欢迎莅临 IEEE HotICN 中文社区,IEEE HotICN 国际学术会议网站: https://hoticn.com, https://hoticn.cn。

面向大模型与智能体网络的知识驱动新型基础设施

新型网络体系结构 wdp

摘要 (Abstract)

随着计算基础设施迈入大模型(LLM)与智能体互联网(IoA)时代,传统 TCP/IP 架构“尽力而为”的传输范式与“语义盲视”的固有缺陷,已成为制约全局算力协同与跨域可信交互的底层瓶颈。近期围绕 IPv8 草案的行业探讨,深刻暴露出单纯在应用层进行组件叠加已无法弥合物理网络与智能业务之间的结构性矛盾。针对泛在算力路由、网内动态确权及多维成本量化的演进需求,本文系统性地剖析了智能生态网络(Intelligent Eco Networking, IEN)这一新型基础设施演进范式。IEN 通过信息中心网络与区块链共识的深度融合,实现了控制面与数据面的高阶解耦。在数据面,提出了统一多维资源量纲的分层算力调度机制,并构建了基于零信任与去中心化标识(DID)的内容级网内动态鉴授权协议。在控制面,设计了基于“能力-意图-约束”的知识驱动闭环协同模型。结合大模型长上下文推理与多智能体全链路可信追踪两大典型场景的效能分析表明,IEN 能够有效打破传统网络的物理管道限制,为下一代价值互联网提供具备高弹性、算力感知与内生安全底座的中国方案。

1. 引言

1.1 传统网络架构的演进困境与瓶颈

随着互联网应用由早期的简单文本传输过渡到高速流媒体,再到如今的泛在算力服务与分布式智能体交互,底层互联网基础设施的设计缺陷日益显现。传统TCP/IP网络架构以“主机-地址-链路”为核心拓扑进行数据包转发,采取“尽力而为(Best-effort)”的传输范式。这种设计将网络层抽象为单一的管道,对传输的内容语义、参与主体的身份可信度以及计算/存储资源的开销状况缺乏感知能力。

近期,业界围绕IETF Internet-Draft《Internet Protocol Version8(IPv8)》(draft-thain-ipv8)展开了广泛讨论。尽管该草案尚属个人提交的非标准化演进探索,其核心价值并非在于提出了一个新的协议版本号,而在于其集中暴露出传统IP网络在演进过程中的深层痛点。该草案尝试将边界网关协议演进(BGP8)、路由注册确权、身份认证(OAuth2/JWT)、多维成本因子路由(CF routing)以及网络状态监测(NetLog8)等机制强行整合至同一网络管理图谱中[1]。

面向大模型与智能体网络的知识驱动新型基础设施插图

这一尝试深刻反映出一种历史性趋势,未来网络面临的交互主体已不再仅仅是物理主机与拓扑地址,而是大量的内容数据、算力服务、大模型调用及复杂的智能体行为。如果网络层的抽象依旧停留在“将IP报文从拓扑源地址送达目的地址”的低维阶段,那么涉及内容寻址、动态权限校验、全网计算资源匹配及服务成本量化的复杂问题,就必须被推向应用层、平台层或运维层进行重复且碎片化的处理。这种“网络层盲目、应用层打补丁”的烟囱式架构,必然引发各层级之间高昂的开销振荡与优化冲突,极大降低了整网系统的运转效率与可扩展性。

1.2 泛在大模型与智能体网络带来的新挑战

进入大模型(LLM)与智能体互联网(Internet of Agents,IoA)时代后,传统网络架构的这种“语义与资源盲视”缺陷被进一步推向了台前。网络基础设施不仅要承担高带宽的数据搬运任务,还必须深度参与到计算与服务调度的闭环中。具体而言,大模型和智能体网络对新型基础设施提出了三方面前所未有的严苛挑战。

  • 多维算力资源感知的路由挑战:在大模型分布式推理场景下,请求路由决策已远非传统的链路时延(RTT)或丢包率所能决定。用户的连续对话伴随着状态化上下文(KVCache)的生成。如前沿LLMServing系统(如Mooncake)所示,若网络层缺乏对节点算力队列、GPU运行状态及已有KVCache缓存位置的精确感知,盲目按照最短网络路径转发请求,将导致目的节点重复计算或产生高昂的跨节点数据传输开销[8,10,12,13]。因此,传统路由的成本度量必须从单一的“链路指标”跨越到包含计算能效、存储状态、服务延迟在内的“多维资源成本”。
  • 读写场景下网内动态确权与可信追踪挑战:当前的智能体(Agent)正加速从只读(Read-only)的资料检索转向读写(Read-write)的复杂工作流协同,能够代表用户调用各类工具、访问异构数据并执行状态修改。在此背景下,传统的基于网络边界防火墙或应用层单次静态登录的认证范式彻底失效。由于内容流、服务流在网络中高度动态地被缓存、复用与转发,网络层必须引入零信任(Zero Trust)理念[12]与网内(In-network)细粒度鉴授权机制。当内容节点命中请求或智能体跨域调用下游工具时,网络需要实时校验请求主体的身份可信度与授权责任链,防止敏感数据的越权访问与行为抵赖。
  • 面向复杂业务意图的知识化控制挑战:在庞大的智能生态中,不同业务任务对网络基础设施的内在约束各异。普通查询任务注重极低时延,写操作严控权限与审计,而大模型分布式训练同步则对RoCE网络的拥塞控制、吞吐量和稳定性有极端要求。传统控制面因无法识别任务意图,只能执行单一的物理转发策略。未来的网络控制面必须转变为“知识驱动”,能够综合分析节点的能力状态、业务的真实意图及策略边界的多重约束,在路由与资源调度时实现多目标的最优匹配。

1.3 本文探讨的核心视点与IEN融合框架

针对上述挑战,单纯在传统IP协议栈上进行零碎的“打补丁式”修正(如IPv8草案所设想的组件简单叠加)难以从根本上解决跨层优化的结构性矛盾。为此,本文立足于智能生态网络长期的研究主线,探讨一种将内容识别、可信关系、资源度量、价值导向与知识驱动[3]融为一体的新型网络基础设施演进视角。本文并非旨在提出单一的新型协议,而是系统性地梳理并融合以下三大核心视点。

  • 从链路路由向多维资源分层调度的演进视点:探讨如何将计算能效、内存状态、传输延迟等异构资源指标统一纳入网络节点的算力量纲评估体系[7]。论述IEN基于分层协同决策的网内资源调度机制与IETF CATS[8]、多维成本路由(CF routing)[1]等前沿理念的互补与融合,以应对大模型与泛在计算感知的网络路由需求。
  • 从边界防护向网内内容级动态确权的演进视点:结合零信任架构理念,剖析IEN在数据内容鉴授权方面的交互流程设计[5]。探讨在内容被广泛缓存与复用的高度动态环境中,如何实现伴随内容请求、流转与智能体跨域交互的全链路可信追踪与授权责任确认。
  • 从单一可达性向“能力-意图-约束”知识驱动的演进视点:基于知识定义网络(KDN)的基本逻辑,论述IEN如何将服务能力感知、业务语义意图识别和策略边界约束引入网络控制面。探讨在多智能体协同与大模型推理场景下,资源状态与闭环调度如何赋能底层网络架构,实现知识驱动的系统最优化调度。

2. 下一代互联网演进的动因与需求分析

新型网络基础设施的演进并非源于纯粹的理论推演,而是由日益突出的上层应用瓶颈所驱动。随着大模型(LLM)与智能体(Agent)等计算密集型、交互密集型业务的爆发,传统IP网络的“语义盲视”与“资源盲视”缺陷日益凸显。本节将从算力路由、动态确权及成本量化三个维度,深入剖析下一代互联网面临的核心技术痛点与演进需求。

2.1 基于大模型推理与训练的算力路由需求

传统互联网的尽力而为(Best-Effort)模型主要解决主机的拓扑可达性问题,其核心假设是“网络仅负责数据搬运,端系统负责计算与状态管理”。然而,在大模型时代,这一假设已成为制约系统整体效能的瓶颈。

在大模型分布式推理场景下,长上下文的交互高度依赖于历史状态(如KVCache)的驻留与复用。当前沿的LLM服务系统(例如Mooncake架构)在处理连续对话请求时,若底层网络仍采用传统的盲目负载均衡或最短路径路由(最短RTT),极易将请求调度至未命中缓存的算力节点。这不仅会导致目标节点算力的重复损耗,还将引发巨大的跨节点数据传输延迟与GPU队列排队成本。

在大模型分布式训练侧,Meta等机构在利用RoCE(RDMA over Converged Ethernet)网络支撑大规模AI训练的工程实践中表明[14],单纯增加GPU数量已无法实现算力的线性扩展,网络层面的带宽瓶颈、拥塞控制与拓扑可靠性已直接成为训练效能的决定性因素。因此,未来的网络基础设施亟需具备“算力感知(Computing-Aware)”能力,使得请求的转发能够与节点的算力余量、内存状态及服务质量目标(SLO)实现端到端的协同调度。

2.2 智能体协作场景下的动态信任边界与网内确权

随着智能体互联网(Internet of Agents,IoA)的快速演进,网络交互的主体正发生根本性的范式转移。早期的Agentic AI主要停留在只读(Read-only)的资料检索层级。而随着应用场景的深入,智能体开始进入读写(Read-write)的复杂工作流[11],具备了代表用户自动发现服务、调用跨域工具、修改系统状态的能力。

在这种高度自治与跨域协作的场景中,传统的信任边界模型面临失效。过去依赖网络边界防火墙或应用层“单次登录验证”的静态安全机制,无法应对内容与服务在网内被频繁缓存、复用与接力调用的动态特性。借鉴零信任架构的核心理念,未来网络不可再默认内部拓扑天然可信,而必须围绕数据与资源实施持续验证。当智能体在网络中发起一次具有状态修改属性的操作时,网络基础设施需要有能力沿着数据流向,追溯该请求的发起者身份、校验其授权范围(鉴权),并生成不可篡改的责任链记录(确权)。这就要求认证与授权机制必须从应用层入口下沉,转变为伴随数据与服务流转的“网内动态确权(In-network Authorization)”。

2.3 传统路由成本评估的维度缺失与多维量化挑战

无论是应对大模型算力协同还是智能体的可信交互,底层网络在进行路由与控制决策时,都必须依赖更精确、更多维的代价度量体系。然而,当前IP网络在评估路径质量时,指标高度单一(主要局限于网络时延、跳数及丢包率),缺乏对真实业务开销的刻画。

近期引发热议的IPv8草案中提出了成本因子路由(CF routing)的设想,试图将时延、带宽、链路稳定性及自定义成本策略纳入累计代价的计算模型中。与之类似,IETF的CATS(Computing-Aware Traffic Steering)工作组也正致力于研究如何将网络状态与计算服务状态进行联合评估[8],以实现流量引导的全局最优化。结合上述研究趋势可以发现,下一代网络必须建立涵盖多层级的成本量纲模型。

  • 网络层成本:如传统RTT、吞吐量与链路拥塞状态。
  • 服务层成本:如目标服务实例的存活状态、排队长度与并发处理能力。
  • 算力/任务层成本:如边缘节点处理与中心集群回源对全局计算资源的消耗差异。

综上所述,成本路由的核心挑战并非简单增加几个评估字段,而是网络系统如何感知异构资源的实时状态,并将其统一转化为可度量的数学量纲。这正是单一维度的协议修补无法解决的问题,从而构成了本文提出IEN系统性融合架构的核心动因。

3. 智能生态网络(IEN)体系架构设计

针对传统IP网络在算力感知、动态确权及多维开销度量等方面的结构性缺失,单纯依赖应用层“补丁”或单一网络协议字段的修补(如IPv8草案中的组件叠加)已无法从根本上消除跨层优化的开销振荡。为此,IEN提供了一种系统性的网络基础设施演进蓝图。IEN不仅是一种新型的网络协议,更是一种将内容识别、可信关系、资源度量、价值导向与知识驱动深度融合的体系架构[6]。本节将系统阐述IEN的演进范式、平面重构设计以及闭环控制模型。

3.1 架构演进范式与总览

传统IP网络采用“以主机为中心(Host-Centric)”的演进范式,将网络拓扑地址作为转发与路由的核心依据。这种设计导致网络层无法感知传输内容的语义,亦无法评估底层的计算与存储开销。IEN则实现了向“以内容为中心(Content-Centric)”和“计算与传输融合(In-Network Computing)”的范式转移。

IEN的总体架构基于信息中心网络(ICN/NDN)、分布式账本(区块链)以及人工智能技术的深度融合,形成“链网融合”的新型基础设施体系。架构自底向上解耦为三个核心层面。

  • 语义原生与数据转发层(数据面):摒弃物理拓扑地址寻址,采用层次化命名的数据块作为网络的基本传输单元,实现语义原生的内容识别与网内缓存命中。
  • 分布式可信与价值流转层(链网融合面):引入去中心化标识(DID)与分布式账本技术,将网络节点、数据要素和智能体行为转化为可信的数字资产,为其提供全局一致的身份确权、权限管理和价值度量底座。
  • 知识驱动与协同调度层(控制面):作为网络的“中枢大脑”,全面搜集网内拓扑、节点算力状态及任务意图,通过机器学习与决策算法实施跨全网的多目标最优化资源调度。

3.2 控制面与数据面的深度解耦与重构

在IEN体系结构中,控制面与数据面经历了超越传统SDN(软件定义网络)的深层次重构。传统SDN仅实现了控制逻辑(流表下发)与转发行为的分离,而IEN则进一步实现了内容语义、信任关系与资源状态在底层网络架构中的统一抽象与深度解耦。

3.2.1 数据面的语义原生与内生安全

传统网络的安全机制(如TLS/SSL)是建立在通道可信(Pipe Security)的基础上的,一旦数据离开传输通道或被网内节点缓存,其可信度便无法验证。IEN数据面基于信息中心网络设计,采用“面向内容本身的安全(Object Security)”机制。每一块数据内容均携带层次化签名与访问权限约束。内容请求(Interest包)与数据响应(Data包)均通过名字进行匹配,数据包内置数字签名。网络节点和智能体在转发或复用缓存内容时,无需依赖最外层的应用入口登录,即可直接在网内完成内容级的动态鉴权。数据面不仅负责数据块的转发,还将节点的计算服务(如大模型推理功能函数)和存储资源(如KVCache缓存)统一抽象为可寻址的网络资源,打破了“传输”与“计算”的边界。

3.2.2 全局网络问题图谱的控制面抽象

控制面不再仅仅维护一张拓扑拓扑表,而是构建了一个集成了“内容识别-可信关系-资源度量”的多维网络问题图谱。控制面通过将上层智能体的业务意图转化为图谱中的约束条件,将底层的链路带宽、时延、计算队列、存储空间统一作为图谱中的边权与节点状态,从而在底层网络路由时,能够直接求解出最优的服务协同路径。

3.3 知识驱动与价值导向的闭环控制模型

IEN的核心控制哲学可以概括为“知识驱动(Knowledge-Driven)”与“价值导向(Value-Oriented)”的闭环协同[3]。这两者并非抽象的概念宣称,而是有着明确的技术内涵与状态流转机制。

3.3.1 价值导向的资源量化与共识激励

在大模型基础设施与多智能体协作场景中,算力消耗与数据复用必须具备明确的成本账本。IEN的“价值导向”机制依托于链网融合架构,通过去中心化标识(DID)和网络非同质化数据要素的融合,将节点的闲置GPU算力、内存空间以及网内缓存的数据资产进行精细化量纲度量与产权化。当一个大模型推理请求在边缘节点命中KVCache或被调度至特定算力集群时,底层账本能够自动记录该次服务对全局资源的占用,为跨域的资源共享、智能体行为审计及成本分摊提供不可篡改的共识数据。

3.3.2 知识驱动的“能力-意图-约束”自适应闭环

基于知识定义网络(KDN)的基本逻辑,IEN控制面将机器学习和策略控制深度结合,形成了一个面向任务语义的智能闭环。

  • 能力感知(Capability Perception):控制面持续监测并推演全网节点的服务能力,包括计算资源量纲(CPU/GPU负载、排队时延)和存储资源状态(KVCache命中概率)。
  • 意图识别(Intent Recognition):网络层能够解析上层任务的类型(如区分低时延的短文本查询、高吞吐的大模型分布式训练同步或高动态的智能体跨域写操作)。
  • 约束求解(Constraint Solving):结合任务的时延SLO、安全边界及预算上限,控制面在线实时求解多目标优化问题,将策略动态注入数据面。

通过这种知识与价值的双驱闭环,IEN成功将底层网络的物理调度能力与上层大模型/智能体的业务逻辑无缝缝合,为应对未来更高复杂度的泛在智能交互提供了高弹性的底层架构范式。

4. 基于 IPv8 关联背景的 IEN 关键机制解剖  

近期引发广泛讨论的 IPv8 草案(draft-thain-ipv8),其本质价值在于将原本散落在网络各个层级的边缘问题(路由成本因子、身份认证、管理平面等)强行整合到了一个统一的网络话语体系中。这种组件的强行叠加,恰恰映射出现代网络在面对大模型算力调度与智能体(Agent)可信交互时,底层机制的捉襟见肘。本节结合原始文献的内核,深入解剖智能生态网络(IEN)如何基于“链网融合”与“内容中心”的思维范式,对成本、认证和知识驱动三大核心演进支柱进行底层重构与交账。

面向大模型与智能体网络的知识驱动新型基础设施插图1

4.1 网内算力与传输联合度量

在传统 IP 网络或 IPv8 草案所设想的“成本因子路由(CF routing)”中,成本的度量依然局限于网络层本身的物理指标,如链路时延(RTT)、带宽、丢包率以及管理策略开销。即便当前 IETF CATS(算力感知网络)工作组尝试将计算状态引入流量引导,由于底层 IP 架构缺乏对传输语义的感知,其决策往往也是应用层与网络层相互割裂的“两阶段”拼接。

IEN 认为,在大模型分布式推理与泛在智算时代,“网络成本”的内涵已经发生了根本性的升维。它必须转变为一种涵盖“传输、计算、存储”的多维联合代价函数。 以大模型长上下文推理场景为例,用户的连续对话请求伴随着 KV Cache 状态的动态驻留。此时,盲目追求网络路径的最短 RTT 极易引发高昂的“冷节点重新计算成本”,而强行拉回中心智算集群,又会产生巨大的“跨网带宽挤占与数据回源成本”。

IEN 基于信息中心网络(ICN)原生路由机制,在底层建立了异构资源联合开销评估模型。网络路由决策不再仅仅算链路多快,而是将目的节点的功能函数可用性、当前 GPU 队列排队时延以及 KV Cache 缓存命中率统一转化为可度量的成本量纲。通过这种多维成本因子的底层融合,IEN 能够在网络转发层面直接权衡“在近端重新计算”与“去远端命中缓存”的综合能效比,从根本上化解了传统网络因“资源盲视”导致的算力孤岛与跨层振荡难题。

4.2 数据对象原生与网内动态确权

IPv8 草案在处理安全问题时,尝试将应用层的 OAuth2、JWT(JSON Web Token)等认证组件直接“下沉”打包进网络协议栈中。这一做法虽然看到了网络层身份缺失的痛点,但其实质依然属于“在管道上打补丁”。由于其认证机制是绑定在通信端点(主机地址)之间的,一旦数据内容脱离了原始服务器的物理边界、在网内发生高频缓存与二次分发,这种基于“通道安全”的信任链条就会瞬间瓦解。

在多智能体高自治交互的今天,Agent 正加速从“只读”走向“读写”的跨域协作,调用各类 API 并执行状态修改。如果安全机制依然依赖传统的边界防火墙或单点应用层登录,极易引发越权访问和全链路审计缺失。

IEN 引入零信任架构资产,将认证范式从传统的“通道安全”彻底推向了“对象安全”与“数据确权”的全新维度。在 IEN 数据面中,每一个被传输的数据块和智能体请求都原生地内嵌了去中心化标识和多层层次化数字签名。这意味着数据本身即具备“可信度”,无需依赖最外层的服务器通道。

当智能体的写操作或内容命中请求流经 IEN 缓存节点时,底层路由器能够沿着数据流向,在网内实时校验请求主体的身份合法性与授权链。这种伴随内容流转而触发的动态确权机制,为高度自治的 AI 协同网络拉起了一条不可篡改、全链路可追溯的内生安全边界。

4.3 面向“能力-意图-约束”的知识驱动

长久以来,“知识驱动网络”在传统 IP 语境下往往沦为一种概念化的宣称。传统路由协议(如 BGP、OSPF)的核心逻辑是机械式的规则匹配与静态拓扑收敛。即便引入了所谓的自动化运维或浅层的机器学习,由于控制面无法感知业务层的真实语义与意图,它依然只能在物理管道的转发规则里打转。

而在 IEN 的设计哲学中,知识驱动是底层架构能够动态响应大模型与智能体复杂业务约束的智能中枢。 IEN 结合知识定义网络的基本逻辑,将网络控制面重塑为一个能够持续运转、自我演进的“智能闭环系统”。这一系统的运行核心可以提炼为对“能力-意图-约束”多维网络图谱的在线求解。控制面通过网络遥测技术,实时感知全网节点的多维资源水位(网络拓扑、GPU 负载、KV Cache 分布)。网络层能够深度解析上层业务的意图。例如,自动识别当前的流量属于注重极低延迟的长上下文对话,还是严控访问权限的智能体跨域写操作。结合多方协同策略边界(资源合规性、用户预算限制等)。

控制面的智能大脑在接收到任务意图后,能够自适应地求解多目标优化约束问题,动态调整数据面的多维资源路由权重,将流量精准、按需地引导至全局最优解。这种知识驱动的闭环,让基础设施彻底告别了“盲目管道”的宿命,完成了网络控制平面向可编程、自适应、语义化的历史性跃升。

5. 总结与展望(Conclusion)

纵观互联网半个多世纪的演进史,传统TCP/IP架构凭借其极致简洁的“尽力而为(Best-effort)”连通性模型,成功支撑了从极客网络到全球消费级移动互联网的跨越。然而,当底层算力基础设施步入大模型(LLM)时代,当上层应用生态演进至高度自治的多智能体网络(IoA)时,网络层“语义盲视”与“资源盲视”的历史局限性已成为制约系统整体效能的最大瓶颈。近期业界关于IPv8草案的讨论,其本质正是这种底层焦虑的集中投射——强行在应用层和平台层进行无尽的“打补丁”,已无法弥合物理网络与智能业务之间的巨大鸿沟。

本文系统性地回应了这一时代诉求,立足于智能生态网络(IEN)架构,提出了一种从根本上打破封闭体系的新型基础设施演进范式。IEN并非对现有协议的简单修补,而是通过控制面与数据面的深度重构,完成了三大核心机制的跨越。

在成本与路由维度,提出了多维资源统一量纲模型与分层协同的算力路由,实现了网络从“尽力搬运”向“算力感知与全局最优化调度”的蜕变。在认证与安全维度,结合零信任理念,构建了基于去中心化标识(DID)的内容级网内动态确权协议,为多智能体跨域协作确立了坚实的责任审计边界。在控制与管理维度,建立了“能力-意图-约束”闭环的知识化网络协同优化框架,使底层网络真正成为具备自我演进能力的智能底座。

参考资料

[1] J. Thain, Internet Protocol Version 8 (IPv8), Internet-Draft draft-thain-ipv8, IETF Datatracker, 2026. https://datatracker.ietf.org/doc/draft-thain-ipv8/

[2] IANA, IP Version Numbers. https://www.iana.org/assignments/version-numbers/version-numbers.xhtml

[3] 雷凯、黄硕康、方俊杰、黄济乐、谢莹莹、彭博, Intelligent Eco Networking (IEN): Knowledge-Driven and Value-Oriented Future Internet Infrastructure, Journal of Applied Sciences, 2020. DOI: 10.3969/j.issn.0255-8297.2020.01.012

[4] ICNLab, 智能生态网络 IEN 2022:面向 Web3.0 的内容中心链网融合架构, 2022. https://www.icnlab.cn/?p=6505

[5] 雷凯、黄硕康, 一种网络中数据内容的鉴授权方法和计算机可读存储介质, WO2021223097A1, 2021.

[6] 雷凯、汪建平、刘斌、黄硕康, 一种网内资源的量纲测量方法、算力调度方法及存储介质, CN112003660A, 2020.

[7] 雷凯、景晓军、李渝, 一种分层协同决策的网内资源调度方法及系统、存储介质, CN112346854A, 2021.

[8] Cheng Li et al., A Framework for Computing-Aware Traffic Steering (CATS), IETF Internet-Draft draft-ietf-cats-framework-24, RFC Editor Queue, 2026. https://datatracker.ietf.org/doc/draft-ietf-cats-framework/

[9] Yuntao Wang, Shaolong Guo, Yanghe Pan, Zhou Su, Fahao Chen, Tom H. Luan, Peng Li, Jiawen Kang, Dusit Niyato, Internet of Agents: Fundamentals, Applications, and Challenges, arXiv, 2025. https://arxiv.org/abs/2505.07176

[10] Ruoyu Qin, Zheming Li, Weiran He, Mingxing Zhang, Yongwei Wu, Weimin Zheng, Xinran Xu, Mooncake: A KVCache-centric Disaggregated Architecture for LLM Serving, arXiv, 2024. https://arxiv.org/abs/2407.00079

[11] Developing.dev, Turing Award Winner: Postgres, Disagreeing with Google, Future Problems | Mike Stonebraker, 2026. https://www.developing.dev/p/turing-award-winner-postgres-disagreeing

[12] Scott Rose, Oliver Borchert, Stu Mitchell, Sean Connelly, Zero Trust Architecture, NIST SP 800-207, 2020. https://doi.org/10.6028/NIST.SP.800-207

[13] Albert Mestres et al., Knowledge-Defined Networking, ACM SIGCOMM Computer Communication Review, 2017. DOI: https://doi.org/10.1145/3138808.3138810

[14] Adi Gangidi, James Hongyi Zeng, RoCE Networks for Distributed AI Training at Scale, Meta Engineering, 2024. https://engineering.fb.com/2024/08/05/data-center-engineering/roce-network-distributed-ai-training-at-scale/

喜欢 (0)