人工智能Self-evolving LLM Agents with In-distribution Optimization 1. 摘要(Abstract) 本文研究的是长程交互型 LLM Agent 的训练问题,核心关注点是稀疏延迟奖励下的贡献归因。随着大语言模型从静态文本生成逐渐走向环境交互,LLM Agent 需要在网页购物、虚拟实验、家居任务等复杂环境中进行连续决策。然而,这类任务通常只... cz 9小时前
人工智能Hierarchical Reinforcement Learning with Augmented Step-Level Transitions for LLM Agents 1. 摘要(Abstract) 本文研究的是 LLM Agents 在长程交互任务中的强化学习训练问题。现有大模型智能体在完成复杂环境任务时,通常会把完整的历史交互记录作为上下文输入,包括任务指令、过去观察、动作和中间状态等。这种做法虽然能帮助模型理解当前处境,但也带来了... cz 9小时前
互联网Towards Next-Generation Global IoT: Empowering Massive Connectivity with Harmonious Multi-Network Coexistence 1. 论文概述与研究背景 本论文针对LoRaWAN作为全球IoT基础设施所面临的扩展性挑战展开深入探讨。LoRaWAN以其低成本、长距离和低功耗特性,成为连接数百万IoT设备的首选技术。然而,实际运营网络显示出显著的容量限制问题。作者通过对真实运营LoRaWAN网络的实证... hhx 2天前
人工智能SkILLOPT: Executive Strategy forSelf-Evolving Agent Skills 1. 论文概述与引言 SKILLOPT提出了一种开创性的文本空间优化框架,用于实现代理技能的自进化。该论文深刻指出,当今代理技能主要依赖手工 crafting、单次 LLM 生成或松散的自修订循环,这些方法均无法像深度学习优化器那样提供系统、可控且可重复的改进路径。作者主... hhx 2周前 (06-01)
互联网Astral: A Datacenter Infrastructure for Large Language Model Training at Scale 1. 课题背景与系统目标:应对万亿参数训练挑战 随着大语言模型(LLM)向万亿级参数演进,底层基础设施面临着前所未有的压力。传统的通用数据中心架构在处理 LLM 训练时存在三个核心瓶颈:首先,高密度的算力需求导致单机柜功耗激增,传统风冷系统难以为继;其次,千卡甚至万卡级别... hhx 3周前 (05-25)
互联网MegaScale-Infer: Efficient Mixture-of-Experts Model Serving with Disaggregated Expert Parallelism SIGCOMM 2025 1. 研究背景与核心痛点:MoE 推理的效率瓶颈 随着大语言模型进入“万亿参数时代”,混合专家模型(Mixture-of-Experts, MoE)因其能在增加参数量的同时保持较低的激活计算量,成为了构建超大规模模型的首选架构。然而,在实际... hhx 4周前 (05-18)
人工智能Rethinking Evaluation for LLM Hallucination Detection: A Desiderata, A New RAG-based Benchmark, New Insights 1.摘要(Abstract) 本文研究的是 LLM hallucination detection benchmark(大模型幻觉检测基准) 的评测问题。随着大模型被用于电商、医疗、法律等真实场景,幻觉问题已经不只是模型效果问题,而是直接关系到生成式 AI 的安全使用。虽... cz 4周前 (05-18)
互联网《Internet of Agents:构建异构智能体协同智能网络》——迈向“智能体互联网”的关键一步 随着大语言模型(LLM)能力的快速提升,基于 LLM 的自治智能体(Autonomous Agents)正在成为人工智能领域的重要研究方向。从 AutoGPT、MetaGPT 到各类 AI Agent 系统,研究者不断尝试让智能体具备自主规划、任务分解与协同执行能力。然而,现有... 前康 4周前 (05-13)
互联网SYCCL: Exploiting Symmetry for Efficient Collective Communication Scheduling SIGCOMM 2025 1. 课题背景:集体通信调度的瓶颈与挑战 当前,分布式机器学习(如大语言模型训练)的效率受到集体通信(Collective Communication,如 AllReduce、AllGather)的严重制约。随着模型规模从十亿级向万亿级演进... hhx 1个月前 (05-11)
新型网络体系结构CEIO: A Cache-Efficient Network 1/O Architecture for NIC-CPU Data Paths 1. 摘要与核心贡献 摘要清晰指出,随着网络链路速度扩展至 100Gbps 乃至更高,传统 I/O 加速技术(如 Intel 的 DDIO 和 RDMA)由于 LLC 利用率低而性能受限。CEIO 的核心创新在于:在 NIC 入口处部署 I/O 管理器,通过信用-based 主... hhx 1个月前 (05-09)