Hattrick: Solving Multi-Class TE using Neural Models SIGCOMM ’25: ACM SIGCOMM 2025 Conference September 8 – 11, 2025 Coimbra, Portugal Conference Sponsors: SIGCOMM https://... hhx 1周前 (12-30)
RedTE: Mitigating Subsecond Traffic Bursts with Real-time and Distributed Traffic Engineering ACM SIGCOMM ’24: Proceedings of the ACM SIGCOMM 2024 Conference https://doi.org/10.1145/3651890.3672231 一、全文概述 RedTE是一种基于分布式... hhx 2周前 (12-24)
DiffFP: Learning Behaviors from Scratch via Diffusion-based FictitiousPlay 作者:Akash Karthikeyan, Yash Vardhan Pant 问题背景与动机 自我对弈(self-play)强化学习在博弈性和多智能体任务中已被证明能够学习复杂策略,但在连续动作空间、对手多样性 以及 泛化性 方面仍存在显著挑战,包括: 传... hcl 4周前 (12-12)
PhyDNNs: Bringing Deep Neural Networks to the Physical Layer 打破传统边界,让 AI 更快更省能——PhyDNNs 正在重塑通信与智能终端未来! 在智能设备与实时交互应用高速发展的今天,从增强现实 (AR) 到虚拟现实 (VR),从智能驾驶到无人机,都对实时计算提出了前所未有的要求。然而,深度神经网络(DNN)传统的... 前康 4周前 (12-11)
A Survey on Self-Play Methods in Reinforcement Learning 论文要点 论文提出了一个统一框架来刻画 self-play(智能体与自身或自身历史版本交互以改进策略)的各种方法,按策略更新机制、对手选择与人口管理、博弈类型(零和/非零和、可转性/非可转性)等维度进行分类,并回顾了代表性算法、应用场景与理论/实践挑战,同时列出了未来研究... hcl 1个月前 (12-05)
m3: Accurate Flow-Level Performance Estimationusing Machine Learning 当网络仿真不再“慢 + 重” —— m3 带来突破 在现代数据中心或云服务架构中,网络性能 — 尤其是流 (flow) 完成时间 (Flow Completion Time, FCT) 和尾部时延 (tail latency) — 是决定用户体验和资源效率的关键指标。过去... 前康 1个月前 (12-04)
A Survey of Generative Categories and Techniques in Multimodal Generative Models 论文目的 系统回顾 “多模态大语言模型 (Multimodal Large Language Models, MLLMs)” 的研究进展 — 即那些不仅处理文本 (text),还能处理 / 生成图像 (image)、音乐 (music)、视频 (video)、人体动作 (... hcl 1个月前 (11-28)
Efficient Transformers: A Survey 会议:ICML 2025 论文概述 随着Transformer架构在自然语言处理、计算机视觉等领域的广泛应用,其计算和内存开销成为了限制其进一步应用的瓶颈,尤其是在长文本或大规模数据集的任务中。本文提出了几种新的Transformer变体,通过优化计算路径和改进注意... hcl 2个月前 (11-21)
无人机群协同目标搜索的多智能体强化学习方法 Y. Hou, J. Zhao, R. Zhang, et al. UAV Swarm Cooperative Target Search: A Multi-Agent Reinforcement Learning Approach[J]. IEEE Transactions... hcl 2个月前 (11-15)
NeurIPS唯一满分论文曝光,来自清华上交 四个审稿人全给6分,NeurIPS唯一满分论文炸了! 之所以说它炸,主要是论文给出的结论实在太出人意料了—— 真正决定推理上限的是基座模型本身而非强化学习,且蒸馏比强化学习更有望实现大模型自我进化。 好家伙,这无异于给正炙手可热的RLVR(可验证奖励的强化学习... hcl 2个月前 (11-15)