近日,Linux.do 社区的一则讨论揭示了谷歌 Gemini 在实际应用中的显著短板。一位开发者发帖称,Gemini 在处理技术问题时表现出明显的“不爱搜索”倾向,过度依赖训练数据而非实时信息,导致频繁“幻觉”。具体案例中,用户询问如何开启 GitHub Pages,Gemini 竟直接否认该功能的存在,直至用户强制其执行搜索操作后才修正答案。这种基于旧记忆库回答新问题的行为,不仅影响了开发效率,更引发了用户对大模型事实准确性的担忧。该用户目前正在寻求特定的提示词,试图通过工程手段强制模型执行严谨的“先搜后答”流程。这一事件反映出当前顶尖大模型在知识时效性与工具调用主动性上仍存在亟待解决的逻辑断层,这不仅是单一模型的个例,而是整个行业在落地生成式 AI 时面临的挑战:如何在成本、延迟与准确性之间找到最佳平衡点,避免 AI 变成“一本正经胡说八道”的制造机。
事件分析
💡 核心观点:模型“偷懒”本质是推理与检索的策略失衡,原生工具调用的鲁棒性才是衡量大模型实用性的关键。
原文链接:Linux.do






