AI编程 · 架构思考 · 技术人生

Gemini 3模型幻觉频发,Deep Research可靠性受挑战

智谱 GLM,支持多语言、多任务推理。从写作到代码生成,从搜索到知识问答,AI 生产力的中国解法。

用户分享了基于Gemini 3系列开发的Deep Research工具在应用中的幻觉问题。Gemini 3 pro preview在32K上下文内表现良好,但超出则效果差;3 flash虽注意力好但懒惰且内容较浅。当研究Claude-opus-4-5时,模型错误报告上下文为2万而非32K,且不承认opus-4-5版本。作者试图通过审查器重新搜索,但导致正确信息被篡改。文章揭示了AI模型在复杂任务中的可靠性挑战,引发对谷歌AI技术深度的质疑。

原文链接:Linux.do

赞(0)
未经允许不得转载:Toy's Tech Notes » Gemini 3模型幻觉频发,Deep Research可靠性受挑战
免费、开放、可编程的智能路由方案,让你的服务随时随地在线。

评论 抢沙发

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始