近日,有开发者在使用智谱GLM模型(用户指代为GLM 5.2)测试Agent功能时发现,该模型在工具调用与技能编排方面存在显著局限。在部署名为“qiushi”的第三方技能时,GLM模型无法像GPT或Claude那样根据对话上下文自动触发“arming-thought”等技能入口,导致后续的子技能调用链路中断。相比之下,GPT与Claude能够顺畅地自主启动相关技能并根据实际情况调用子功能。开发者指出,即使在提示词中显式指定使用特定技能,或在毫无逻辑阻碍的场景下,GLM依然拒绝或忽略对子技能的调用请求。这一现象暴露了部分国产大模型在Function Calling(函数调用)或Tool Use(工具使用)层面的严谨性与推理深度不足,难以胜任需要多步推理与自动工具编排的高级智能体任务。
事件分析
💡 核心观点:大模型的竞争维度已从单纯的语言生成转向Agent化的工具调用,自主性与精准度是决定能否落地应用的关键。
原文链接:Linux.do







AI周刊:大模型、智能体与产业动态追踪
程序员数学扫盲课
冲浪推荐:AI工具与技术精选导航