Communication Characterization of AI Workloads for Large-scale Multi-chiplet Accelerators 论文来源:arXiv:2410.22262v2作者:Mariam Musavi, Emmanuel Irabor, Abhijit Das, Eduard Alarcón, Sergi Abadal单位:NaNoNetworking Center in Catalunya (N... 杨, 宗霖 3小时前
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction 1. 研究动机与背景 传统的视觉 自回归(Autoregressive,AR)生成方法通常按光栅扫描(raster-scan)的顺序逐像素或逐 patch 预测下一个 token,而这种策略: 忽略图像的二维结构; 难以并行计算; 在生成质量和生成速度... hcl 15小时前
MME-CoT: Benchmarking Chain-of-Thought in Large Multimodal Models for Reasoning Quality, Robustness, and Efficiency 会议:ICML 2025(第42届国际机器学习大会) Dongzhi Jiang∗ 1 , Renrui Zhang∗† 1 , Ziyu Guo2 , Yanwei Li‡3 , Yu Qi‡4 , Xinyan Chen‡1Liuhui Wang‡5 , Jianha... hcl 2周前 (12-27)
Mastering Multi-Drone Volleyball throughHierarchical Co-Self-Play Reinforcement Learning 一、研究背景与挑战 任务定义:3v3 多无人机排球(Multi-Drone Volleyball)该任务要求三台无人机组成一个团队与另一个三机团队进行排球比赛。它同时具有以下挑战性: 高层策略与低层控制耦合:需要在物理环境中做出战术决策(如团队配合、球路选择)并执... hcl 3周前 (12-19)
m3: Accurate Flow-Level Performance Estimationusing Machine Learning 当网络仿真不再“慢 + 重” —— m3 带来突破 在现代数据中心或云服务架构中,网络性能 — 尤其是流 (flow) 完成时间 (Flow Completion Time, FCT) 和尾部时延 (tail latency) — 是决定用户体验和资源效率的关键指标。过去... 前康 1个月前 (12-04)