随着大语言模型（LLM）能力的快速提升，基于 LLM 的自治智能体（Autonomous Agents）正在成为人工智能领域的重要研究方向。从 AutoGPT、MetaGPT 到各类 AI Agent 系统，研究者不断尝试让智能体具备自主规划、任务分解与协同执行能力。然而，现有多智能体系统大多仍停留在“封闭式协作”阶段：智能体之间缺乏统一协议、跨平台协同能力有限、通信流程高度固化，难以适应真实开放环境中的复杂协作需求。

在这一背景下，ICLR 2025 论文《Internet of Agents: Weaving a Web of Heterogeneous Agents for Collaborative Intelligence》提出了“Internet of Agents（IoA）”框架，尝试像互联网连接人类一样，将不同能力、不同平台、不同设备上的异构智能体连接起来，构建一个开放、自组织、可动态协作的“智能体互联网”。该工作不仅重新定义了多智能体系统的组织方式，也为未来 AI Agent 的大规模协同提供了新的基础设施范式。

《Internet of Agents：构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步插图

一、研究背景与问题动机

近年来，大语言模型的突破推动了智能体技术的快速发展。智能体已经不再只是简单的问答工具，而是逐渐具备任务规划、工具调用、代码执行、知识检索乃至自主决策等能力。在这一趋势下，多智能体协作（Multi-Agent Collaboration）成为提升系统复杂任务处理能力的重要方向。

然而，现有研究大多基于“单框架、单生态”的设计思路。例如，许多系统仅允许内部定义的 Agent 进行交互，不支持第三方异构智能体接入；部分系统虽然支持多智能体协作，但其通信流程往往依赖人工预定义的固定工作流，缺乏动态适应能力。此外，大多数现有系统仍运行在单机模拟环境中，无法反映真实世界中跨设备、跨平台、跨地域的分布式协作场景。

论文指出，真正的智能协作网络应当具备类似互联网的开放性与自治性。未来的 Agent 系统不应只是“多个 Agent 的简单组合”，而应形成一个能够动态组织、自主通信、自适应协同的智能网络。基于这一动机，作者提出了 Internet of Agents（IoA）框架，希望构建一种面向开放环境的异构智能体协作体系。

二、传统方法的局限性

论文系统分析了当前多智能体系统存在的三类核心问题。

首先，现有方法普遍存在“生态孤岛”问题。许多 Agent 框架仅支持自身生态内部的智能体协作，不同平台之间缺乏统一的通信协议与接口标准。这导致第三方 Agent 难以接入，也限制了系统能力的扩展性与多样性。

其次，传统多智能体系统大多依赖单设备运行。大量研究是在单机环境中模拟多个 Agent 的协作过程，而真实世界中的智能体往往分布于云端、边缘设备甚至移动终端。单机模拟难以支撑未来大规模分布式 Agent 网络的发展需求。

最后，现有系统通常采用固定通信流程。任务执行顺序、角色分工以及状态转换大多依赖人工预定义规则，缺乏自主调整能力。这种“硬编码式协作”虽然便于实现，但难以应对开放环境中的复杂动态任务。

换言之，传统方法更像是“静态工作流系统”，而不是一个真正具备开放协作能力的智能网络。

三、论文的核心思想与创新点

针对上述问题，论文提出了 Internet of Agents（IoA）框架，其核心思想是：以互联网的组织方式构建智能体协作系统，使异构 Agent 能够像互联网中的节点一样实现动态连接与自主协同。

论文首先提出了 Agent Integration Protocol（智能体接入协议）。该协议为不同 Agent 提供统一接口，使第三方智能体能够以标准化方式接入系统。这一设计类似于互联网中的 TCP/IP 协议，为异构 Agent 的互联互通提供了基础。

其次，论文提出了 Autonomous Nested Team Formation（自主嵌套团队机制）。与传统固定 Pipeline 不同，IoA 中的 Agent 可以根据任务需求动态创建子团队，并进一步递归形成更深层次的协作结构。例如，在论文写作任务中，一个主团队可以自动生成“文献检索团队”“PDF 阅读团队”“代码执行团队”等多个子团队，从而形成类似组织结构的树状协作体系。

此外，论文还提出了 Autonomous Conversation Flow Control（自主会话流控制机制）。作者将 Agent 间的通信过程建模为有限状态机（FSM），包括讨论、任务同步、异步执行、暂停等待以及总结等状态。不同于传统系统中人工定义状态转换规则，IoA 利用大语言模型自主决定下一阶段的协作状态以及发言主体，从而实现更加灵活的动态协同。

从本质上看，这篇论文最大的创新并不仅仅在于“多智能体”，而在于将多智能体系统从“静态流水线”推进到“互联网式智能网络”。论文尝试回答一个更深层的问题：未来的 AI Agent 是否能够像互联网中的人类一样，实现开放、自治、动态的大规模协同。

四、实验设计与实验结果分析

《Internet of Agents：构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步插图1

为了验证 IoA 的有效性，论文分别在通用任务、开放任务、具身智能任务以及检索增强任务上进行了系统实验。

在 GAIA Benchmark 上，论文重点测试了 IoA 对异构工具型 Agent 的协同能力。实验中集成了 Web Browser Agent、Code Executor Agent、YouTube Transcript Agent 等多种工具型智能体，并与 AutoGPT、AutoGen 等主流方法进行比较。实验结果表明，IoA 在复杂任务上的整体性能明显优于现有方法，尤其在高难度 Level 2 与 Level 3 任务中优势更加显著。

在开放任务实验中，作者进一步验证了 IoA 对不同 Agent 框架的兼容能力。论文直接接入了 AutoGPT 与 Open Interpreter 等第三方 Agent，并构建了包含代码生成、信息检索、数学推理以及生活辅助等 153 个开放任务的数据集。实验结果显示，IoA 相比 AutoGPT 获得了 76.5% 的胜率，相比 Open Interpreter 获得了 63.4% 的胜率，证明其异构协同机制具备较强的泛化能力。

在具身智能实验中，论文采用 RoCoBench 数据集验证异构观察空间与动作空间下的协同能力。IoA 在 Cabinet、Sandwich、Sort 等任务中均取得了接近或达到 100% 的成功率，展现出优秀的多智能体协调能力。

此外，在 RAG 多智能体协作任务中，论文基于 TriviaQA、Natural Questions、HotpotQA 与 2WikiMultiHopQA 等数据集开展实验。结果表明，仅使用 GPT-3.5 的 IoA 系统，其整体性能已经能够接近甚至部分超过 GPT-4。这说明通过合理的 Agent 协同机制，可以显著提升系统整体智能水平。

总体来看，论文实验覆盖了工具协同、开放任务、具身协作以及知识推理等多个场景，较全面地验证了 IoA 的通用性与有效性。

五、总结与展望

《Internet of Agents》并不仅仅提出了一个新的多智能体框架，更重要的是，它提出了一种“智能体互联网”的全新范式。论文将 Agent 从“固定工作流中的执行单元”提升为“开放网络中的自治节点”，使智能体具备了动态连接、自主组队与灵活协同的能力。

从研究趋势来看，IoA 所代表的“Agent Internet”方向具有非常重要的意义。一方面，它为未来大规模异构智能体协作提供了统一基础设施；另一方面，它也为云边端协同、多智能体自治网络以及智能体互联网的发展奠定了理论与系统基础。

随着 AI Agent 数量与复杂度的持续提升，未来的智能系统很可能不再依赖单一超大模型，而是由大量异构 Agent 通过类似互联网的方式协同完成复杂任务。IoA 的提出，正是迈向这一未来的重要一步。