Efficient Transformers: A Survey 会议:ICML 2025 论文概述 随着Transformer架构在自然语言处理、计算机视觉等领域的广泛应用,其计算和内存开销成为了限制其进一步应用的瓶颈,尤其是在长文本或大规模数据集的任务中。本文提出了几种新的Transformer变体,通过优化计算路径和改进注意... hcl 2天前
无人机群协同目标搜索的多智能体强化学习方法 Y. Hou, J. Zhao, R. Zhang, et al. UAV Swarm Cooperative Target Search: A Multi-Agent Reinforcement Learning Approach[J]. IEEE Transactions... hcl 1周前 (11-15)
NeurIPS唯一满分论文曝光,来自清华上交 四个审稿人全给6分,NeurIPS唯一满分论文炸了! 之所以说它炸,主要是论文给出的结论实在太出人意料了—— 真正决定推理上限的是基座模型本身而非强化学习,且蒸馏比强化学习更有望实现大模型自我进化。 好家伙,这无异于给正炙手可热的RLVR(可验证奖励的强化学习... hcl 1周前 (11-15)
李飞飞和LeCun的世界模型之争 Jay 发自 凹非寺量子位 | 公众号 QbitAI AGI之路,终于交汇到了世界模型的战场。 李飞飞,发布了旗下首款商用世界模型Marble; 几乎同一时间,Lecun离职Meta,准备创立自己的世界模型公司; 在此之前,谷歌旗下的世界模型Geni... hcl 1周前 (11-15)
LLM-Enhanced Heterogeneous Graph Embedding Model for Multi-Task DNS Security 《LLM-Enhanced Heterogeneous Graph Embedding Model for Multi-Task DNS Security》融合大语言模型的异构图嵌入(Heterogeneous Graph Embedding)DNS安全多任务检测域名系统(DN... 中文社区管理员 3周前 (11-04)
Nature 强化学习AI超越了人类设计的算法! 强化学习是人工智能领域的核心技术之一,其基本原理模拟了生物学习的本质:通过与环境互动、接收反馈并调整行为来提升性能。从AlphaGo击败围棋世界冠军,到ChatGPT展现出惊人的语言能力,背后都离不开强化学习的支撑。然而,长期以来,这些系统的学习规则都需要人类专家精心设计和调优... 中文社区管理员 4周前 (10-29)
ByteScale: Communication-Efficient Scaling of LLM Training with a 2048K Context Length on 16384 GPUs Hao Ge (Peking University); Junda Feng, Qi Huang (ByteDance Inc.); Fangcheng Fu (Shanghai Jiao Tong University); Xiaonan Nie, Lei Zuo, Haib... hcl 2个月前 (09-15)
论文分享——面向边缘人工智能计算的区块链技术综述 出处:应用科学学报,2020年第38卷第1期,P1-21 作者:方俊杰 雷凯 摘要:区块链构建了一个分布式点对点的系统,作为一种安全可验证的分散确认事务的机制,广泛应用于金融经济、物联网、大数据、云计算和边缘计算领域.边缘人工智能计算(edge AI computi... 中文社区管理员 2年前 (2023-07-28)
面向边缘人工智能计算的区块链技术综述 摘要: 区块链构建了一个分布式点对点的系统,作为一种安全可验证的分散确认事务的机制,广泛应用于金融经济、物联网、大数据、云计算和边缘计算领域. 边缘人工智能计算(edge AI computing) 即面向边缘网络应用场景的群智AI 计算模式. 在无人驾驶等高动态、超低延时、资... 中文社区管理员 4年前 (2021-11-12)