由深圳河套学院、哈工大(深圳)、深圳市大数据研究院与华为相关团队组成的联合攻关团队,依托深智城 AI 算力平台,宣布在国产 AI 算力平台上成功跑通 1.6 万亿参数大模型 DeepSeek-V4-Pro 的全参数后训练(Post-training)。这是全球第三方机构首次在国产算力平台上完成如此大规模模型的全参数后训练任务。相较于预训练,后训练阶段虽无需处理海量初始数据,但对于 1.6 万亿参数的 MoE(混合专家)架构模型而言,其对底层硬件的显存容量、多卡间通信带宽(特别是 MoE 路由触发的全对全通信)以及大规模集群稳定性要求极高。联合团队利用超千张华为昇腾 910C 芯片组成的算力集群,通过优化分布式承载与负载均衡策略,成功克服了通信瓶颈。在长达 1500 多步的训练过程中,系统实现了零中断,模型算力利用率(MFU)超过 30%,关键算子效率提升 14%,各项指标均达到工业级运行标准。业内普遍认为,此次实验不仅验证了华为昇腾 910C 集群在承载超大规模模型训练时的技术可行性,更标志着国产算力生态正加速从以往仅支持推理或小参数微调,向支撑超大参数模型全参数训练的技术闭环过渡。
事件分析
💡 核心观点:华为昇腾910C成功支撑DeepSeek万亿模型全参数训练,标志着国产AI算力软硬件栈实现从“推理可用”到“训练能打”的关键跨越。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战