近日,有开发者在技术社区报告了小米系大模型“mimo-v2.5-pro”在开启思考模式时存在的一个严重 Bug。使用 Anthropic Python SDK 调用该模型时,若将参数 `thinking` 设为 `enabled` 并提问简单的问候或基础计算题,模型能正常输出思考过程与最终答案。然而,当面对如“糖果口味与形状组合概率”等复杂逻辑推理问题时,虽然模型内部生成了长达 6000 至 12000 字符的详细思考链,但最终返回的文本块长度却为 0,导致答案完全丢失。测试表明,该故障与思考过程的长度强相关,推测原因可能是思考过程消耗了过多预算,导致最终输出生成被截断或 API 处理逻辑存在缺陷。
事件分析
💡 核心观点:长思考链不仅是智力比拼,更是工程落地的试金石,资源分配机制需持续优化。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪