中昊芯英正式推出了新一代全自研高性能 TPU AI 专用芯片「须臾」,以及同步亮相的软硬件一体化智算底座「泰则 2.0」。在硬件性能方面,「须臾」的单芯片混合精度浮点算力达到 896 TFLOPS,8-bit 推理算力高达 1792 TOPS,其性能不仅是上一代产品「刹那」的 3 倍,更在显存容量和芯片内部互联速率上实现了大幅提升,能够有效支持超长上下文处理。值得关注的是,该芯片在提升算力的同时,将单卡额定功耗控制在 600W,相比传统算力芯片功耗降低 50%,显著助力低碳数据中心建设。
在核心技术自主性方面,「须臾」实现了从芯片 IP 核、专属指令集到底层算子加速库及整机系统软件的完整自主研发,无海外核心技术依赖,完全满足政务、金融、电网等关键行业的安全合规要求。同步发布的「泰则 2.0」平台作为标准计算单元,搭载两路高性能 CPU 与 8 片高性能 TPU,总算力达 7.168P,同等任务下整机能耗仅为传统 GPU 服务器的 80%。软件生态层面,该平台已实现对 PyTorch、vLLM、SGLang 等主流 AI 框架的全兼容,并完成了 DeepSeek、Qwen 全系列、GLM、MiniMAX 等数十款大语言及多模态模型的深度适配,极大便利了开发者的模型迁移工作。
事件分析
💡 核心观点:国产TPU通过软硬一体化优化能效比并积极拥抱主流开源生态,为大模型推理提供了更具性价比与安全可控的算力新选项。
原文链接:Linux.do






