云聚 AI Token Plan 满 199 减 35 元
port:80 AI Junkie
AI 重度玩家的工程笔记本
DigitalOcean 开发者云

中昊芯英发布新一代TPU芯片「须臾」:算力达896TFLOPS,支持DeepSeek等大模型

云聚 AI Token Plan 满 199 减 35 元

中昊芯英正式推出了新一代全自研高性能 TPU AI 专用芯片「须臾」,以及同步亮相的软硬件一体化智算底座「泰则 2.0」。在硬件性能方面,「须臾」的单芯片混合精度浮点算力达到 896 TFLOPS,8-bit 推理算力高达 1792 TOPS,其性能不仅是上一代产品「刹那」的 3 倍,更在显存容量和芯片内部互联速率上实现了大幅提升,能够有效支持超长上下文处理。值得关注的是,该芯片在提升算力的同时,将单卡额定功耗控制在 600W,相比传统算力芯片功耗降低 50%,显著助力低碳数据中心建设。

在核心技术自主性方面,「须臾」实现了从芯片 IP 核、专属指令集到底层算子加速库及整机系统软件的完整自主研发,无海外核心技术依赖,完全满足政务、金融、电网等关键行业的安全合规要求。同步发布的「泰则 2.0」平台作为标准计算单元,搭载两路高性能 CPU 与 8 片高性能 TPU,总算力达 7.168P,同等任务下整机能耗仅为传统 GPU 服务器的 80%。软件生态层面,该平台已实现对 PyTorch、vLLM、SGLang 等主流 AI 框架的全兼容,并完成了 DeepSeek、Qwen 全系列、GLM、MiniMAX 等数十款大语言及多模态模型的深度适配,极大便利了开发者的模型迁移工作。

阿里云 OPC 一人公司创业装备库

事件分析

此次发布的核心看点在于国产 AI 芯片在能效比与软硬协同上的双重突破。「须臾」芯片在维持 600W 功耗的同时提供高达 896 TFLOPS 的算力,展现了在推理场景下的高能效优势,这直接对应了当前大模型落地中算力成本过高与能耗巨大的痛点。产业层面,中昊芯英不仅强调硬件参数,更着重展示了「泰则 2.0」平台对 DeepSeek、vLLM 等热门模型和推理框架的原生兼容。这表明国产芯片厂商正逐渐意识到,单纯的硬件堆砌不足以撼动现有市场格局,构建易用、迁移成本低的软件生态是打破 CUDA 护城河的关键。此外,全栈自研的特性使其在特定垂直行业(如金融、政务)具备显著的合规竞争优势。

💡 核心观点:国产TPU通过软硬一体化优化能效比并积极拥抱主流开源生态,为大模型推理提供了更具性价比与安全可控的算力新选项。

原文链接:Linux.do

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:80aj » 中昊芯英发布新一代TPU芯片「须臾」:算力达896TFLOPS,支持DeepSeek等大模型
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐