近日,开发者社区 Linux.do 上关于智谱 GLM 新版本(文中提及 GLM-5.2/ZCode)的性能引发了激烈讨论。针对网络上关于其“推广嫌疑”与“实际好用”的争议,一位开发者进行了实机对比测试。测试选取了基于 Generic Agent 框架的代码重构任务,横向对比了 GLM 最新版本与 GPT-5.5(文中提及)在处理中小型项目时的表现。实测结果显示,GLM 模型在 21 分钟内完成了任务,而 GPT 模型耗时约 40 分钟。在完成度方面,两者均达到了基本可用的标准。技术分析指出,GLM 的胜出主要归功于其原生支持 100 万 token 的超长上下文窗口,这使得 AI 能够一次性摄入完整项目库,无需像 GPT 那样为了规避上下文限制而采用繁琐的“子代理”拆分策略。这一实测案例打破了关于国产大模型的刻板印象,证明了在长文本处理能力和工程落地效率上,国产模型已具备与顶尖闭源模型分庭抗礼的实战能力。
事件分析
💡 核心观点:百万级上下文让单一大模型取代繁琐的多智能体协作,国产大模型在工程落地效率上已具备“越级打击”能力。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航
Claude Code 全体系指南:AI 编程智能体实战