欢迎莅临 IEEE HotICN 中文社区,IEEE HotICN 国际学术会议网站: https://hoticn.com, https://hoticn.cn。

《Internet of Agents:构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步

互联网 前康

随着大语言模型(LLM)能力的快速提升,基于 LLM 的自治智能体(Autonomous Agents)正在成为人工智能领域的重要研究方向。从 AutoGPT、MetaGPT 到各类 AI Agent 系统,研究者不断尝试让智能体具备自主规划、任务分解与协同执行能力。然而,现有多智能体系统大多仍停留在“封闭式协作”阶段:智能体之间缺乏统一协议、跨平台协同能力有限、通信流程高度固化,难以适应真实开放环境中的复杂协作需求。

在这一背景下,ICLR 2025 论文《Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence》提出了“Internet of Agents(IoA)”框架,尝试像互联网连接人类一样,将不同能力、不同平台、不同设备上的异构智能体连接起来,构建一个开放、自组织、可动态协作的“智能体互联网”。该工作不仅重新定义了多智能体系统的组织方式,也为未来 AI Agent 的大规模协同提供了新的基础设施范式。

《Internet of Agents:构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步插图

一、研究背景与问题动机

近年来,大语言模型的突破推动了智能体技术的快速发展。智能体已经不再只是简单的问答工具,而是逐渐具备任务规划、工具调用、代码执行、知识检索乃至自主决策等能力。在这一趋势下,多智能体协作(Multi-Agent Collaboration)成为提升系统复杂任务处理能力的重要方向。

然而,现有研究大多基于“单框架、单生态”的设计思路。例如,许多系统仅允许内部定义的 Agent 进行交互,不支持第三方异构智能体接入;部分系统虽然支持多智能体协作,但其通信流程往往依赖人工预定义的固定工作流,缺乏动态适应能力。此外,大多数现有系统仍运行在单机模拟环境中,无法反映真实世界中跨设备、跨平台、跨地域的分布式协作场景。

论文指出,真正的智能协作网络应当具备类似互联网的开放性与自治性。未来的 Agent 系统不应只是“多个 Agent 的简单组合”,而应形成一个能够动态组织、自主通信、自适应协同的智能网络。基于这一动机,作者提出了 Internet of Agents(IoA)框架,希望构建一种面向开放环境的异构智能体协作体系。

二、传统方法的局限性

论文系统分析了当前多智能体系统存在的三类核心问题。

首先,现有方法普遍存在“生态孤岛”问题。许多 Agent 框架仅支持自身生态内部的智能体协作,不同平台之间缺乏统一的通信协议与接口标准。这导致第三方 Agent 难以接入,也限制了系统能力的扩展性与多样性。

其次,传统多智能体系统大多依赖单设备运行。大量研究是在单机环境中模拟多个 Agent 的协作过程,而真实世界中的智能体往往分布于云端、边缘设备甚至移动终端。单机模拟难以支撑未来大规模分布式 Agent 网络的发展需求。

最后,现有系统通常采用固定通信流程。任务执行顺序、角色分工以及状态转换大多依赖人工预定义规则,缺乏自主调整能力。这种“硬编码式协作”虽然便于实现,但难以应对开放环境中的复杂动态任务。

换言之,传统方法更像是“静态工作流系统”,而不是一个真正具备开放协作能力的智能网络。

三、论文的核心思想与创新点

针对上述问题,论文提出了 Internet of Agents(IoA)框架,其核心思想是:以互联网的组织方式构建智能体协作系统,使异构 Agent 能够像互联网中的节点一样实现动态连接与自主协同。

论文首先提出了 Agent Integration Protocol(智能体接入协议)。该协议为不同 Agent 提供统一接口,使第三方智能体能够以标准化方式接入系统。这一设计类似于互联网中的 TCP/IP 协议,为异构 Agent 的互联互通提供了基础。

其次,论文提出了 Autonomous Nested Team Formation(自主嵌套团队机制)。与传统固定 Pipeline 不同,IoA 中的 Agent 可以根据任务需求动态创建子团队,并进一步递归形成更深层次的协作结构。例如,在论文写作任务中,一个主团队可以自动生成“文献检索团队”“PDF 阅读团队”“代码执行团队”等多个子团队,从而形成类似组织结构的树状协作体系。

此外,论文还提出了 Autonomous Conversation Flow Control(自主会话流控制机制)。作者将 Agent 间的通信过程建模为有限状态机(FSM),包括讨论、任务同步、异步执行、暂停等待以及总结等状态。不同于传统系统中人工定义状态转换规则,IoA 利用大语言模型自主决定下一阶段的协作状态以及发言主体,从而实现更加灵活的动态协同。

从本质上看,这篇论文最大的创新并不仅仅在于“多智能体”,而在于将多智能体系统从“静态流水线”推进到“互联网式智能网络”。论文尝试回答一个更深层的问题:未来的 AI Agent 是否能够像互联网中的人类一样,实现开放、自治、动态的大规模协同。

四、实验设计与实验结果分析

《Internet of Agents:构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步插图1

为了验证 IoA 的有效性,论文分别在通用任务、开放任务、具身智能任务以及检索增强任务上进行了系统实验。

在 GAIA Benchmark 上,论文重点测试了 IoA 对异构工具型 Agent 的协同能力。实验中集成了 Web Browser Agent、Code Executor Agent、YouTube Transcript Agent 等多种工具型智能体,并与 AutoGPT、AutoGen 等主流方法进行比较。实验结果表明,IoA 在复杂任务上的整体性能明显优于现有方法,尤其在高难度 Level 2 与 Level 3 任务中优势更加显著。

在开放任务实验中,作者进一步验证了 IoA 对不同 Agent 框架的兼容能力。论文直接接入了 AutoGPT 与 Open Interpreter 等第三方 Agent,并构建了包含代码生成、信息检索、数学推理以及生活辅助等 153 个开放任务的数据集。实验结果显示,IoA 相比 AutoGPT 获得了 76.5% 的胜率,相比 Open Interpreter 获得了 63.4% 的胜率,证明其异构协同机制具备较强的泛化能力。

在具身智能实验中,论文采用 RoCoBench 数据集验证异构观察空间与动作空间下的协同能力。IoA 在 Cabinet、Sandwich、Sort 等任务中均取得了接近或达到 100% 的成功率,展现出优秀的多智能体协调能力。

此外,在 RAG 多智能体协作任务中,论文基于 TriviaQA、Natural Questions、HotpotQA 与 2WikiMultiHopQA 等数据集开展实验。结果表明,仅使用 GPT-3.5 的 IoA 系统,其整体性能已经能够接近甚至部分超过 GPT-4。这说明通过合理的 Agent 协同机制,可以显著提升系统整体智能水平。

总体来看,论文实验覆盖了工具协同、开放任务、具身协作以及知识推理等多个场景,较全面地验证了 IoA 的通用性与有效性。

五、总结与展望

《Internet of Agents》并不仅仅提出了一个新的多智能体框架,更重要的是,它提出了一种“智能体互联网”的全新范式。论文将 Agent 从“固定工作流中的执行单元”提升为“开放网络中的自治节点”,使智能体具备了动态连接、自主组队与灵活协同的能力。

从研究趋势来看,IoA 所代表的“Agent Internet”方向具有非常重要的意义。一方面,它为未来大规模异构智能体协作提供了统一基础设施;另一方面,它也为云边端协同、多智能体自治网络以及智能体互联网的发展奠定了理论与系统基础。

随着 AI Agent 数量与复杂度的持续提升,未来的智能系统很可能不再依赖单一超大模型,而是由大量异构 Agent 通过类似互联网的方式协同完成复杂任务。IoA 的提出,正是迈向这一未来的重要一步。

喜欢 (0)