欢迎莅临 IEEE HotICN 中文社区,IEEE HotICN 国际学术会议网站: https://hoticn.com, https://hoticn.cn。

标签:智能生态网络

互联网

Astral: A Datacenter Infrastructure for Large Language Model Training at Scale

Astral: A Datacenter Infrastructure for Large Language Model Training at Scale
1. 课题背景与系统目标:应对万亿参数训练挑战 随着大语言模型(LLM)向万亿级参数演进,底层基础设施面临着前所未有的压力。传统的通用数据中心架构在处理 LLM 训练时存在三个核心瓶颈:首先,高密度的算力需求导致单机柜功耗激增,传统风冷系统难以为继;其次,千卡甚至万卡级别...

hhx 3天前