专注于分布式系统架构AI辅助开发工具(Claude
Code中文周刊)

Claude幻觉率测试胜出:远超GPT与Gemini

智谱 GLM,支持多语言、多任务推理。从写作到代码生成,从搜索到知识问答,AI 生产力的中国解法。

在Linux.do论坛上,一位用户对主流AI模型Claude、GPT和Gemini进行了联网搜索能力测试,针对信息源稀少的问题评估幻觉率。结果显示,Claude Sonnet 4.5表现最佳,幻觉率0%,搜索三轮即获取正确信息;GPT 5.2幻觉率70%,搜索效率低;Gemini 3 Pro幻觉率超90%,搜索效果差。作者强调Claude在工具使用能力上遥遥领先,如项目管理、文件操作等,并已从GPT转向Claude为主力。文章呼吁AI厂商加强工具集成,提升生产力,突破模型瓶颈。该测试为AI用户提供实用参考,揭示了模型性能差异和未来发展方向。

原文链接:Linux.do

赞(0)
未经允许不得转载:Toy Tech Blog » Claude幻觉率测试胜出:远超GPT与Gemini
免费、开放、可编程的智能路由方案,让你的服务随时随地在线。

评论 抢沙发

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始