欢迎莅临 IEEE HotICN 中文社区,IEEE HotICN 国际学术会议网站: https://hoticn.com, https://hoticn.cn。

ICNP 2025论文报道 之 AI4Net

未分类 hcl

第 33 届 IEEE ICNP 于 2025 年 9 月在韩国首尔召开,本次大会共计 238 篇投稿,录用 60 篇(录用率为 25%)。

由 DANCE GROUP 郑陈粤带来会议报道。

Copo: Joint Cost and Performance Optimization for Task Placement in Geo-Distributed Clouds

Bichen Wang, Jingzhou Wang, Yu-E Sun, He Huang

  Soochow University, China 

图片

介绍

云计算快速发展下,头部云服务厂商通常建设地理分布式的数据中心,以 “区域” 架构来部署集群支撑全球服务。但这样做的服务成本高昂:一是跨地域任务部署的资源消耗,二是跨区域通信的带宽支出。而现有方案存在短板,要么仅优化单一成本,要么忽视性能指标。因此,本文提出Copo 框架,通过任务部署与流量传输联合决策,实现地理分布式云的成本与性能协同优化。

核心思想与贡献

Copo 的核心思想是通过将双层优化问题(上层成本优化、下层性能优化)转化为单层优化问题,并设计了高效的近似算法,从而得到任务部署与流量传输的联合决策。其主要贡献为:1)通过引入虚拟节点(任务)与虚拟边(任务 – 区域连接),将原问题转化为经典多商品流问题。2)将成本优化与性能优化构建为双层优化模型,基于KKT条件,将下层性能优化等效转化为上层优化的约束条件。3)基于 McCormick 包络松弛方法,将二次规划问题转化为线性规划问题,再结合随机舍入算法来求解任务部署与流量传输的联合决策。

实验评估

区域数据集采用华为云数据,任务数据集采用阿里的trace数据,评估电力成本、带宽成本、总成本和负载均衡率。结果表明,Copo的电力成本和带宽成本均接近于各自的SOTA方法,总成本表现最优,负载均衡接近最优。

问答:

  1. 用KKT方法来做,优势在哪里?

A: KKT的核心优势在于上下层优化统一到同一个框架中,从而能够做后续的求解。

个人评价:

本文最突出的价值在于打破了现有云任务部署方案 “成本优化” 与 “性能优化” 割裂的局面,构建了兼顾二者的统一框架,并提供了合适的求解方法。值得探究的是该方法是否能进一步扩展到其他领域。

ReWeave: Traffic Engineering with Robust Path Weaving for Localized Link Failure Recovery

Jingyi Guan , Kun Qiu, Jin Zhao

Fudan University Shanghai, China

图片

介绍

ISP 网络中常发生链路故障,为流量工程(TE)引入挑战。现有的TE方案或者依赖静态路径重路由,导致性能下降,或者预计算出大量备份路由,为基于ML的推理方案引入高额开销。因此,本文提出ReWeave,为每条链路配置了紧凑且仅相邻节点的备份路径集;故障时仅故障链路两端的路由器借 SRv6 绕道路径来动态重路由。

核心思想与贡献

ReWeave 的核心思想是利用相邻节点间的路径集,为每条链路配置本地备份路径。在故障发生时刻,通过在本地修复原始全局路径,从而维持一个稳健路径集,使预训练的ML模型持续有效。具体而言,当路由器检测到链路故障时,可以借助SDN通过数据包隐式探测来获取另一端路由器的备用路径,并修改数据包的段标识符(SID)列表实现绕道路由,大幅降低了重路由开销。

实验评估

采用五层全连接神经网络,评估Viatel、Cogentco两个真实网络拓扑,以及north america、africa两个合成拓扑。在单/多链路故障场景下,ReWeave 在所有网络拓扑上的归一化链路利用率表现最佳,优于所有baseline。在开销分析上,ReWeave架构简单,训练时间处于前列,计算时间则优于几乎所有baseline。

问答:

  1. 这篇文章实验中并没有对比LP,为什么说文章的效果最好?

A: LP作为理想最优解,在结果中已经做过了归一化处理。可以体现出本方案的效果。

个人评价:

故障恢复的TE是一个经典的领域,这篇工作通过聚焦链路级的本地化恢复,巧妙避开了传统方法的痛点,既无需控制器的繁琐干预,又能维持预训练 ML 模型的有效性,避免了模型重新训练的高昂成本。在效果有所提升的同时,效率优于其余基于DNN的方法。

Planner: A Generative Graph Learning Framework for Noisy and Dynamic In-band Network Telemetry

Xiaoquan Zhang1, WaiMing Lau1, Lin Cui1, Fung Po Tso2, Zhuoqian Liang1, Zhen Zhang1 and Yuhui Deng1 

 1 Jinan University, Guangzhou. 

 2 Loughborough University, UK

图片

介绍

带内网络遥测(INT)通过将数据嵌入到数据包来实现实时监控,可编程交换机进一步提升了INT在硬件上动态定制的灵活性,可用于负载均衡等场景。但实际部署中,INT数据采集面临数据噪声(丢包、延迟乱序、哈希冲突)与网络动态性(路径调整等)的挑战。当前利用神经网络分析INT数据的研究,未充分考虑交换机资源限制及上述问题,本文提出Planner生成式图学习框架,通过模块化多粒度特征采集、动态图构建等机制来解决问题。

核心思想与贡献

Planner 尝试在适配可编程交换机的特性下,构建模块化的INT框架与混合学习模型。具体而言,支持多粒度特征来采集设备级、流级、包级三类特征,同时,基于INT路径构建动态图,通过节点特征聚合来适配路径的变化,作者在基于Tofino可编程交换机和BMv2构建了testbed验证,在攻击检测、延迟预测任务上优于多种baseline。

实验评估

实验在攻击检测、延迟预测两个场景下评估模型和baseline。模拟了高斯噪声、掩码噪声以及特征攻击等多种干扰。在测试场景中,准确率和召回率显著优于VAE等多个baseline,在动态路径变化场景下表现最优。消融实验表明,各组件均具有必要性。且硬件资源和时间资源的消耗均在可接受范围内。

问答:

  1. 模型是怎么训练的?模型如何适配多种拓扑?

A: 训练数据来自实验中收集的数据集,我们将数据集按照训练集、测试集进行划分。在模型数据收集阶段考虑了多样性。

个人评价:

Planner弥合了INT数据质量与模型需求的一个差距,在攻击检测、延迟预测场景下性能表现和鲁棒性均佳。需要探究的是,如何扩展至其他任务,进一步拓宽应用范围。

Modeling Flow-level Traffic Demand for Network Performance Evaluation and Optimization

Sijiang Huang‡, Xiaohui Xie‡∗, Mowei Wang†, Lingfeng Peng‡, Cong Li§, Yong Zhang§, Yingjie Qin§, Liang Zhang†, Yong Cui‡∗ 

 ‡ Tsinghua University, Beijing, China 

 †Huawei Technologies, Beijing, China 

 §Industrial and Commercial Bank of China, Beijing, China

图片

介绍

流量建模与生成是TE的核心需求,流级别模型(以五元组表征)因精准捕捉应用需求,在网络评估、设计验证等场景中有重要价值。但主流方法依赖流量分布同质化等与实际不符的简化假设,导致生成的流量保真度低,严重影响评估优化的准确性。本方案通过分析某大型企业的生产流量,提出 Encore 框架,以分而治之的策略,通过CVAE捕捉分布异质性、条件GRU捕捉时间动态性,从而生成高保真合成流量轨迹。

核心思想与贡献

Encore针对流级别流量的分布异质性与序列时间依赖性两个特征分别建模。在分布上,利用CVAE做特征提取,同时引入动态平衡以及KL散度的loss,解决时间分布差异问题;在序列上,基于GRU模型处理时序数据,将流大小与到达时间组成的 “流对” 作为基本建模单元进行训练。此外,Encore 在设计中保留了隐私保护,通过模型参数实现流量生成,避免信息泄露。

实验评估

数据集来自某大型商业银行的骨干网出口流量数据,以及用于验证模型效果的公开数据集。对比了分层贝叶斯等主流模型。本方案在分布建模上,准确率和覆盖率均大幅优于现有方法。在序列建模中,除少数情况持平外,大多数情况指标均优于现有baseline。同时,本方案的训练效率高,成本适中。生成效率远优于现有的网络模拟器。

问答:

  1. 训练过程中使用的数据集是什么?是私有数据吗?

A: 数据集来自两个来源,一是基于某企业的私有数据集,二是互联网的公开数据集。

个人评价:

Encore利用模型能力,提供了 “高保真且易用” 的流量生成工具。实际中可以进一步探讨,除了支撑网络性能评估与优化这一任务外,如何扩展至其他场景,例如生成攻击流量、新协议验证等供多样流量输入。借助 “流量大模型” 来构建通用建模框架可能成为未来这一领域的趋势。

DANCE

    北京邮电大学 DANCE Group,即网络与数据融合 (Data And Network CoordinatE) 课题组,每月论文分享。

课题组详细信息:

http://yuchaozhang.weebly.com/

招生信息 (计算机17组、软件06组):

https://scs.bupt.edu.cn/info/1020/2675.htm

喜欢 (0)