MegaScale: Scaling Large Language Model Training to More Than 10,000 GPUs
杨, 宗霖 2周前 (03-29)
杨, 宗霖 2周前 (03-29)
hhx 2周前 (03-27)
hhx 2个月前 (02-04)
hhx 3个月前 (01-12)
前康 4个月前 (11-27)
hcl 6个月前 (09-29)
中文社区管理员 1年前 (2024-11-26)
中文社区管理员 2年前 (2024-09-10)
中文社区管理员 2年前 (2024-09-03)
中文社区管理员 2年前 (2024-08-23)