 

DeepSeek V3.2 Livebench测试排名揭晓

2025-12-16 分类：前沿阅读(59) 评论(0) 赞(0)

智谱 GLM，支持多语言、多任务推理。从写作到代码生成，从搜索到知识问答，AI 生产力的中国解法。

DeepSeek V3.2模型在Livebench基准测试中发布最新成绩，与业界领先AI模型如Claude 4.5 Opus Thinking、Gemini 3 Pro Preview、GPT-5等进行了全面对比。测试结果显示，V3.2在推理项目上排名第九，编程能力排名第十六，agent编程能力排名第十四，数学能力位列第十，数据分析能力表现突出，排名第三。这些数据点反映了当前AI技术的快速迭代和模型间的激烈竞争，为AI从业者、研究者和开发者提供了重要参考，帮助评估不同模型的性能优劣，推动人工智能技术的前沿发展。测试结果还突显了DeepSeek在特定领域的竞争力，特别是数据分析领域的强劲表现。

原文链接：Linux.do

赞(0)

未经允许不得转载：Toy's Tech Notes » DeepSeek V3.2 Livebench测试排名揭晓

分享到

评论抢沙发

前沿哨所

星链更新隐私政策：允许利用用户数据训练AI模型

SpaceX旗下星链更新全球隐私政策，允许在用户未选择退出的情况下，利用客户数据训练其机器学习或AI模型。此前的政策版本中并未包含相关条款。据悉，SpaceX正计划与马斯克的AI公司xAI合并，此次政策调整可能为xAI提供包括位置、通信信息在内的庞大数据集。星链目前拥有超过900万用户，该变更引发了隐私倡导者的担忧，认为缺乏明确的使用限制可能导致监控风险。

原文链接：Hacker News

27分钟前
彭博社：苹果AI人才大量流失，或因不满外包谷歌

据彭博社报道，苹果公司近期遭遇严重的人才流失，多名顶级AI研究员及一名Siri高管相继离职。内部知情人士透露，部分核心成员对苹果计划将部分生成式AI功能外包给谷歌表示强烈不满，认为此举扼杀了内部创新。这一事件正值苹果全力追赶OpenAI和谷歌等竞争对手的关键节点，揭示了其在AI战略落地与团队建设之间面临的深层矛盾。

原文链接：Linux.do

27分钟前
Antigravity 403报错？教你用安卓手机快速解锁谷歌API权限

针对Antigravity Tools调用时出现的API 403错误，本文提供了一套快速解决方案。用户在触发错误提示后，通过浏览器跳转至验证界面，利用安卓手机相机扫描二维码进行身份确认。整个过程无需在手机端登录对应谷歌账号，仅需几秒即可解除访问限制。这一方法有效解决了开发者和AI爱好者在使用谷歌前沿工具时遇到的权限风控问题。

原文链接：Linux.do

27分钟前
Gemini Pro封号潮反调查：探究“幸存”账号的规律与风控逻辑

针对近期Gemini Pro账号大规模封禁现象，技术社区发起了一项反向调查，旨在统计未受封号影响的用户情况。调查涵盖使用方法、账号属性及用户画像三个维度，试图通过对比封号数据，寻找未被风控的规律。此举旨在分析AI服务商可能针对用户特征实施的限流策略，为用户提供规避封号风险的参考。

原文链接：Linux.do

27分钟前
谷歌 Gemini AI Pro 疑似严打，用户反馈大量订阅失效

近期，科技社区反馈 Google Gemini AI Pro 服务出现大面积“掉签”现象。多位用户报告称，手动注册的账号丢失了高级订阅权益，相比之下，通过第三方特定渠道购买的账号目前状态更为稳定。数据显示，此次受影响的账号主要集中在1月初注册的用户群体，而去年底认证的旧账号暂未受波及。这一现象引发了外界对谷歌正在收紧风控策略、大力清理异常账号的猜测。

原文链接：Linux.do

2小时前
Google AI Pro订阅突遭撤销，高频率使用或触发风控

一名用户反馈使用了两个月的Google AI Pro订阅突然失效，订阅管理选项消失。该账号作为工作号高频使用，涉及CLI工具调用、UI设计生图等场景。分析认为，封禁原因可能包括使用非官方Workspace接入、网络代理冲突、多设备登录或账号曾有申诉记录。此事件提醒用户，谷歌的风控机制正在收紧，非正规获取或高强度使用AI服务风险增加。

原文链接：Linux.do

2小时前