AI编程 · 架构思考 · 技术人生

AI心算乘法能力测试:ChatGPT表现亮眼,但上下文存疑

智谱 GLM,支持多语言、多任务推理。从写作到代码生成,从搜索到知识问答,AI 生产力的中国解法。

在最新的AI能力测试中,研究人员通过提示词让AI模型不借助工具心算一道复杂乘法题:836478824乘以78352。测试结果显示,ChatGPT网页版、Gemini 3.0网页版思考模式以及Cursor中的Opus4.5模型成功完成了计算,而Sonnet4.5网页版则未能通过。这一发现表明,当前主流AI模型在基础数学计算上已取得显著进步,能够处理高精度心算任务。然而,分析指出,思考模式在效率上仍存在不足,特别是面对更大数据时,上下文限制可能导致思考过程中断。尽管如此,相比过去AI完全无法进行此类计算,这一进展标志着AI推理能力的重要飞跃,为未来更复杂的应用奠定了基础。

原文链接:V2EX 分享发现

赞(0)
未经允许不得转载:Toy's Tech Notes » AI心算乘法能力测试:ChatGPT表现亮眼,但上下文存疑
免费、开放、可编程的智能路由方案,让你的服务随时随地在线。

评论 抢沙发

十年稳如初 — LocVPS,用时间证明实力

10+ 年老牌云主机服务商,全球机房覆盖,性能稳定、价格厚道。

老品牌,更懂稳定的价值你的第一台云服务器,从 LocVPS 开始