据社区最新反馈及第三方平台监测数据显示,DeepSeek 在近期对其网页端及 App 的“专家模式”服务进行了显著的性能优化,推理响应速度实现了大幅提升。多名用户在进行反向代理测试及实际使用中观察到,模型生成速度已稳定达到每秒 100 tokens(t/s)的水平,这一数值显著优于此前平均水平,处于目前主流大模型推理速度的第一梯队。同时,通过 OpenRouter 等聚合平台的实时数据看板可以确认,DeepSeek 位于新加坡、印度等多个数据中心的吞吐量均呈现持续且稳定的上涨态势。这一现象表明,此次提速并非局部的临时波动,而是源于后端基础设施的实质性扩容或算法层面的深度优化。更快的推理速度不仅极大地提升了用户在长文本生成、代码编写及逻辑推理等复杂场景下的交互体验,也意味着 DeepSeek 在处理高并发请求时的算力调度能力得到了增强,这对于降低大规模模型的使用门槛和推动商业化落地具有重要积极意义。
事件分析
💡 核心观点:DeepSeek 推理实测突破 100 t/s 标志着其基建层完成关键升级,AI 模型正从“能用”向“低延迟、高并发”的实时生产力工具加速进化。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战