云聚 AI Token Plan 满 199 减 35 元
AI编程 · 架构思考 · 技术人生
DigitalOcean 开发者云

阶跃星辰开源 Step 3.7 Flash:面向 Agent 优化,生成速度飙升至 400 Tokens/s

云聚 AI Token Plan 满 199 减 35 元

阶跃星辰今日正式发布并开源了新一代 Flash 模型——Step 3.7 Flash。作为一款专门面向 Agent 生产化阶段推出的模型,Step 3.7 Flash 围绕 Agent、Coding、Search 及多模态工作流进行了系统级的深度优化,旨在解决构建高吞吐量自动化智能体工作流时的性能瓶颈。该模型最显著的亮点在于其极致的推理速度,最高生成速度可达每秒 400 Tokens,这一特性使其成为高频、多轮对话及对低延迟有严格要求场景的理想选择。在规格方面,该模型支持 256k 的长上下文窗口,能够处理大规模文本数据。同时,为了满足不同开发场景的需求,Step 3.7 Flash 提供了低、中、高三个推理级别,允许开发者根据实际业务逻辑,在响应速度、Token 成本与模型能力之间进行精细化的权衡。此外,阶跃星辰还针对 Claude Code、KiloCode、RooCode 等主流 Agent 框架,以及 MCP、Skills 等工具调用协议进行了广泛的兼容性优化,从而显著降低了模型接入门槛和工作流编排的复杂度,助力开发者更高效地构建 AI 应用。

事件分析

Step 3.7 Flash 的发布标志着大模型厂商在推动 AI Agent 落地方面,已从单纯的“能力竞赛”转向“效率与生态适配”的深水区。每秒 400 Tokens 的生成速度,直击了当前 AI Agent 应用中普遍存在的交互延迟痛点,尤其是在代码生成(Coding)和复杂工具调用场景中,高吞吐量是实现流畅用户体验的关键。通过提供低、中、高三级推理选项,该模型实际上是在推行一种“分层部署”的策略,使得开发者可以将简单任务分配给低成本推理,仅在必要时调用高算力资源,这符合当前行业对降低 Token 成本、提升 ROI 的迫切需求。与此同时,对 MCP 协议及 Claude Code 等主流开发框架的原生支持,显示出模型厂商正试图通过消除兼容性壁垒,将自己嵌入到现有的开发者工具链中,从而加速 AI 从“聊天玩具”向“生产力工具”的实质性转化。

💡 核心观点:Step 3.7 Flash 以极速推理和分级部署策略,精准切中了 AI Agent 商业化落地对实时响应与成本控制的双重刚需。

阿里云 OPC 一人公司创业装备库

原文链接:Linux.do

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:Toy's Tech Notes » 阶跃星辰开源 Step 3.7 Flash:面向 Agent 优化,生成速度飙升至 400 Tokens/s
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐