 

AI数学能力大比拼：Gemini和Grok表现最佳

2025-12-14 分类：前沿阅读(76) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

本文作者为了凑单购物，设计了一道数学题测试各大AI模型的能力。题目要求使用指定数字（99,39,59等）加起来之和最接近599但要大于599，且必须包含99，数字可重复。测试对象包括Gemini、ChatGPT、Claude、DeepSeek、Grok和豆包。结果显示，Gemini和Grok成功给出最优解总和600，而DeepSeek、ChatGPT、Claude和豆包回答错误。这项测试揭示了不同AI在解决逻辑和数学问题上的差异，为用户在选择AI工具时提供了有价值的参考，突显了Gemini 3.0 Pro的强大性能。同时，测试也反映了AI在实际应用中的局限性，强调了模型优化的重要性，对于科技爱好者和AI开发者来说，这是一个有趣且实用的案例研究。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » AI数学能力大比拼：Gemini和Grok表现最佳

分享到

AI 数学能力模型比较

评论抢沙发

前沿哨所

星链更新隐私政策：允许利用用户数据训练AI模型

SpaceX旗下星链更新全球隐私政策，允许在用户未选择退出的情况下，利用客户数据训练其机器学习或AI模型。此前的政策版本中并未包含相关条款。据悉，SpaceX正计划与马斯克的AI公司xAI合并，此次政策调整可能为xAI提供包括位置、通信信息在内的庞大数据集。星链目前拥有超过900万用户，该变更引发了隐私倡导者的担忧，认为缺乏明确的使用限制可能导致监控风险。

原文链接：Hacker News

32分钟前
彭博社：苹果AI人才大量流失，或因不满外包谷歌

据彭博社报道，苹果公司近期遭遇严重的人才流失，多名顶级AI研究员及一名Siri高管相继离职。内部知情人士透露，部分核心成员对苹果计划将部分生成式AI功能外包给谷歌表示强烈不满，认为此举扼杀了内部创新。这一事件正值苹果全力追赶OpenAI和谷歌等竞争对手的关键节点，揭示了其在AI战略落地与团队建设之间面临的深层矛盾。

原文链接：Linux.do

32分钟前
Antigravity 403报错？教你用安卓手机快速解锁谷歌API权限

针对Antigravity Tools调用时出现的API 403错误，本文提供了一套快速解决方案。用户在触发错误提示后，通过浏览器跳转至验证界面，利用安卓手机相机扫描二维码进行身份确认。整个过程无需在手机端登录对应谷歌账号，仅需几秒即可解除访问限制。这一方法有效解决了开发者和AI爱好者在使用谷歌前沿工具时遇到的权限风控问题。

原文链接：Linux.do

32分钟前
Gemini Pro封号潮反调查：探究“幸存”账号的规律与风控逻辑

针对近期Gemini Pro账号大规模封禁现象，技术社区发起了一项反向调查，旨在统计未受封号影响的用户情况。调查涵盖使用方法、账号属性及用户画像三个维度，试图通过对比封号数据，寻找未被风控的规律。此举旨在分析AI服务商可能针对用户特征实施的限流策略，为用户提供规避封号风险的参考。

原文链接：Linux.do

32分钟前
谷歌 Gemini AI Pro 疑似严打，用户反馈大量订阅失效

近期，科技社区反馈 Google Gemini AI Pro 服务出现大面积“掉签”现象。多位用户报告称，手动注册的账号丢失了高级订阅权益，相比之下，通过第三方特定渠道购买的账号目前状态更为稳定。数据显示，此次受影响的账号主要集中在1月初注册的用户群体，而去年底认证的旧账号暂未受波及。这一现象引发了外界对谷歌正在收紧风控策略、大力清理异常账号的猜测。

原文链接：Linux.do

2小时前
Google AI Pro订阅突遭撤销，高频率使用或触发风控

一名用户反馈使用了两个月的Google AI Pro订阅突然失效，订阅管理选项消失。该账号作为工作号高频使用，涉及CLI工具调用、UI设计生图等场景。分析认为，封禁原因可能包括使用非官方Workspace接入、网络代理冲突、多设备登录或账号曾有申诉记录。此事件提醒用户，谷歌的风控机制正在收紧，非正规获取或高强度使用AI服务风险增加。

原文链接：Linux.do

2小时前