互联网Towards Next-Generation Global IoT: Empowering Massive Connectivity with Harmonious Multi-Network Coexistence 1. 论文概述与研究背景 本论文针对LoRaWAN作为全球IoT基础设施所面临的扩展性挑战展开深入探讨。LoRaWAN以其低成本、长距离和低功耗特性,成为连接数百万IoT设备的首选技术。然而,实际运营网络显示出显著的容量限制问题。作者通过对真实运营LoRaWAN网络的实证... 1天前
人工智能SkILLOPT: Executive Strategy forSelf-Evolving Agent Skills 1. 论文概述与引言 SKILLOPT提出了一种开创性的文本空间优化框架,用于实现代理技能的自进化。该论文深刻指出,当今代理技能主要依赖手工 crafting、单次 LLM 生成或松散的自修订循环,这些方法均无法像深度学习优化器那样提供系统、可控且可重复的改进路径。作者主... 1周前 (06-01)
互联网Astral: A Datacenter Infrastructure for Large Language Model Training at Scale 1. 课题背景与系统目标:应对万亿参数训练挑战 随着大语言模型(LLM)向万亿级参数演进,底层基础设施面临着前所未有的压力。传统的通用数据中心架构在处理 LLM 训练时存在三个核心瓶颈:首先,高密度的算力需求导致单机柜功耗激增,传统风冷系统难以为继;其次,千卡甚至万卡级别... 2周前 (05-25)
互联网MegaScale-Infer: Efficient Mixture-of-Experts Model Serving with Disaggregated Expert Parallelism SIGCOMM 2025 1. 研究背景与核心痛点:MoE 推理的效率瓶颈 随着大语言模型进入“万亿参数时代”,混合专家模型(Mixture-of-Experts, MoE)因其能在增加参数量的同时保持较低的激活计算量,成为了构建超大规模模型的首选架构。然而,在实际... 3周前 (05-18)
互联网SYCCL: Exploiting Symmetry for Efficient Collective Communication Scheduling SIGCOMM 2025 1. 课题背景:集体通信调度的瓶颈与挑战 当前,分布式机器学习(如大语言模型训练)的效率受到集体通信(Collective Communication,如 AllReduce、AllGather)的严重制约。随着模型规模从十亿级向万亿级演进... 1个月前 (05-11)
新型网络体系结构CEIO: A Cache-Efficient Network 1/O Architecture for NIC-CPU Data Paths 1. 摘要与核心贡献 摘要清晰指出,随着网络链路速度扩展至 100Gbps 乃至更高,传统 I/O 加速技术(如 Intel 的 DDIO 和 RDMA)由于 LLC 利用率低而性能受限。CEIO 的核心创新在于:在 NIC 入口处部署 I/O 管理器,通过信用-based 主... 1个月前 (05-09)
新型网络体系结构Centralium: A Hybrid Route-Planning Framework for Large-ScaleData Center Network Migrations . 研究背景:BGP 在超大规模网络迁移中的局限性 在 Meta(原 Facebook)的超大规模数据中心(DCN)中,网络迁移(如拓扑扩展、设备更迭、链路重组)已成为日常。传统的 BGP 协议虽然在可扩展性和容错性上表现卓越,但在处理动态迁移任务时却显得捉襟见肘。 BG... 1个月前 (04-28)
ICNTGraph: A Tensor-centric Graph Processing Framework 1. 摘要(Abstract) TGraph是首个基于张量的通用图处理框架,旨在解决现有图系统难以跨硬件后端迁移的问题。传统图处理系统(如Ligra、Gunrock、cuGraph等)多针对特定硬件(如NVIDIA GPU或FPGA)进行深度优化,虽然在特定平台上性能突出... 2个月前 (04-20)
人工智能VEGA: An Active-tuning Learned Index with Group-Wise Learning Granularity 1. 摘要(Abstract) VEGA提出了一种全新的只读型(immutable)学习索引,旨在同时实现最先进的经验查询性能和严格的理论查询复杂度保证。现有最快的不变学习索引(如RMI)虽在实际查询吞吐量上表现突出,但缺乏非平凡的最坏情况查询界限;相反,提供紧致界限的索... 2个月前 (04-13)
人工智能SWASH: A Flexible Communication Framework with Sliding Window-Based Cache Sharing for Scalable DGNN Training Proceedings of the ACM on Management of Data, Volume 3, Issue 3 (June 2025) hps://doi.org/10.1145/3725360 EISSN: 2836-6573 1. 摘要(... 2个月前 (04-07)