30 亿参数“从 0 到 1”，摩尔线程-99科技

5月27日，摩尔线程、无问芯穹今天联合宣布，双方已经正式完成基于国产全功能 GPU 千卡集群的 3B 规模大模型“MT-infini-3B”实训，该模型基于摩尔线程国产全功能 GPU MTT S4000 组成的千卡集群，以及无问芯穹的 AIStudio PaaS 平台打造。

据悉，这次的 MT-infini-3B 模型训练总共用时 13.2 天，全程稳定无中断，集群训练稳定性达到 100％，千卡训练和单机相比扩展效率超过 90％，号称“充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性，同时也在行业内率先开启了国产大语言模型与国产 GPU 千卡智算集群深度合作的新范式”。

获悉，实训出来的 MT-infini-3B 性能在同规模模型中跻身前列，相比在国际主流硬件上训练而成的其他模型，在 C-Eval、MMLU、CMMLU 等 3 个测试集上均实现性能领先。

无问芯穹联合创始人兼 CEO 夏立雪表示，当前无问芯穹正在打造“M 种模型”和“N 种芯片”之间的“M x N”中间层产品，实现多种大模型算法在多元芯片上的高效、统一部署，已与摩尔线程达成深度战略合作，而目前“MT-infini-3B”这一训练成果是行业内首次实现基于国产 GPU 芯片从 0 到 1 的端到端大模型实训案例。

30 亿参数“从 0 到 1”，摩尔线程

铭凡UM690WT迷你主机1699元大促

小米室外摄像机BW500上架

文章聚合

美国媒体：NASA无法研究中国带回的月球月背样品背后原因极其愚蠢

洪州大桥：世界级桥梁工程正式通车

微软Windows天气应用全新升级：首页焕新设计，信息展示更加全面

韩国釜山人口萎缩风险加剧，成为首个显现“消失阶段”迹象的大城市

三星Galaxy Ring智能戒指功能：集成心率、压力、体温监测等

河南许昌：女子错转226万元货款至陌生阿姨账户，对方全数退还

安耐美发布全新风晶凌LIQMAXFLO一体水散热器

华为宣布：Apollo Version即将发布，引领5G-A时代新篇章

Cybertruck越野旅行车与FSD自动驾驶技术新突破成焦点

TechInsights：2024年全球智能手机换机率将不再以北美为首

相关文章：