在Linux.do论坛上,一位用户对主流AI模型Claude、GPT和Gemini进行了联网搜索能力测试,针对信息源稀少的问题评估幻觉率。结果显示,Claude Sonnet 4.5表现最佳,幻觉率0%,搜索三轮即获取正确信息;GPT 5.2幻觉率70%,搜索效率低;Gemini 3 Pro幻觉率超90%,搜索效果差。作者强调Claude在工具使用能力上遥遥领先,如项目管理、文件操作等,并已从GPT转向Claude为主力。文章呼吁AI厂商加强工具集成,提升生产力,突破模型瓶颈。该测试为AI用户提供实用参考,揭示了模型性能差异和未来发展方向。
原文链接:Linux.do
最新评论
I don't think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.
这个AI状态研究很深入,数据量也很大,很有参考价值。
我偶尔阅读 这个旅游网站。激励人心查看路线。
文章内容很有深度,AI模型的发展趋势值得关注。
内容丰富,对未来趋势分析得挺到位的。
Thank you for your sharing. I am worried that I lack creative ideas. It is your article that makes me full of hope. Thank you. But, I have a question, can you help me?
光纤技术真厉害,文章解析得挺透彻的。
文章内容很实用,想了解更多相关技巧。