一位开发者在 V2EX 分享了其使用国产大模型(GLM 5.1、Kimi 2.6)与 GPT Copilot 进行原型设计的实战对比。在面对一个包含多级功能清单的复杂 UI 需求时,尽管用户精心编写了防死循环提示词,GLM 5.1 仍因“深度思考”功能陷入反复自我否定的回溯怪圈,导致多次超时未产出代码;Kimi 2.6 则被吐槽处于“纯看代码”状态。相比之下,GPT Copilot 虽然输出了带有“国企风格”的口号文案,却是唯一一次成功生成可用代码的工具,凸显了国产模型在代码生成实战能力与稳定性上的显著差距。
原文链接:V2EX 分享发现










AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航