阶跃星辰今日正式发布并开源了新一代 Flash 模型——Step 3.7 Flash。作为一款专门面向 Agent 生产化阶段推出的模型,Step 3.7 Flash 围绕 Agent、Coding、Search 及多模态工作流进行了系统级的深度优化,旨在解决构建高吞吐量自动化智能体工作流时的性能瓶颈。该模型最显著的亮点在于其极致的推理速度,最高生成速度可达每秒 400 Tokens,这一特性使其成为高频、多轮对话及对低延迟有严格要求场景的理想选择。在规格方面,该模型支持 256k 的长上下文窗口,能够处理大规模文本数据。同时,为了满足不同开发场景的需求,Step 3.7 Flash 提供了低、中、高三个推理级别,允许开发者根据实际业务逻辑,在响应速度、Token 成本与模型能力之间进行精细化的权衡。此外,阶跃星辰还针对 Claude Code、KiloCode、RooCode 等主流 Agent 框架,以及 MCP、Skills 等工具调用协议进行了广泛的兼容性优化,从而显著降低了模型接入门槛和工作流编排的复杂度,助力开发者更高效地构建 AI 应用。
事件分析
💡 核心观点:Step 3.7 Flash 以极速推理和分级部署策略,精准切中了 AI Agent 商业化落地对实时响应与成本控制的双重刚需。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪