hcl的文章

Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction

1. 研究动机与背景传统的视觉自回归（Autoregressive，AR）生成方法通常按光栅扫描（raster-scan）的顺序逐像素或逐 patch 预测下一个 token，而这种策略：忽略图像的二维结构；难以并行计算；在生成质量和生成速度...

6个月前 (01-09)

会议：ICML 2025（第42届国际机器学习大会） Dongzhi Jiang∗ 1 , Renrui Zhang∗† 1 , Ziyu Guo2 , Yanwei Li‡3 , Yu Qi‡4 , Xinyan Chen‡1Liuhui Wang‡5 , Jianha...

7个月前 (12-27)

一、研究背景与挑战任务定义：3v3 多无人机排球（Multi-Drone Volleyball）该任务要求三台无人机组成一个团队与另一个三机团队进行排球比赛。它同时具有以下挑战性：高层策略与低层控制耦合：需要在物理环境中做出战术决策（如团队配合、球路选择）并执...

7个月前 (12-19)

作者：Akash Karthikeyan, Yash Vardhan Pant 问题背景与动机自我对弈（self-play）强化学习在博弈性和多智能体任务中已被证明能够学习复杂策略，但在连续动作空间、对手多样性以及泛化性方面仍存在显著挑战，包括：传...

7个月前 (12-12)

论文要点论文提出了一个统一框架来刻画 self-play（智能体与自身或自身历史版本交互以改进策略）的各种方法，按策略更新机制、对手选择与人口管理、博弈类型（零和/非零和、可转性/非可转性）等维度进行分类，并回顾了代表性算法、应用场景与理论/实践挑战，同时列出了未来研究...

7个月前 (12-05)

论文目的系统回顾 “多模态大语言模型 (Multimodal Large Language Models, MLLMs)” 的研究进展 — 即那些不仅处理文本 (text)，还能处理 / 生成图像 (image)、音乐 (music)、视频 (video)、人体动作 (...

7个月前 (11-28)

会议：ICML 2025 论文概述随着Transformer架构在自然语言处理、计算机视觉等领域的广泛应用，其计算和内存开销成为了限制其进一步应用的瓶颈，尤其是在长文本或大规模数据集的任务中。本文提出了几种新的Transformer变体，通过优化计算路径和改进注意...

8个月前 (11-21)

Y. Hou, J. Zhao, R. Zhang, et al. UAV Swarm Cooperative Target Search: A Multi-Agent Reinforcement Learning Approach[J]. IEEE Transactions...

8个月前 (11-15)

四个审稿人全给6分，NeurIPS唯一满分论文炸了！之所以说它炸，主要是论文给出的结论实在太出人意料了—— 真正决定推理上限的是基座模型本身而非强化学习，且蒸馏比强化学习更有望实现大模型自我进化。好家伙，这无异于给正炙手可热的RLVR（可验证奖励的强化学习...

8个月前 (11-15)

AGI之路，终于交汇到了世界模型的战场。李飞飞，发布了旗下首款商用世界模型Marble；几乎同一时间，Lecun离职Meta，准备创立自己的世界模型公司；在此之前，谷歌旗下的世界模型Genie 3，也曾掀起业界轰动。 AI界三股大佬力量，虽然同...

8个月前 (11-15)