第三方LLM接口大起底:性能造假高达47%,学术圈严查“假模型”
亥姆霍兹信息安全中心最新发布的论文《Real Money, Fake Models》揭露了AI基础设施领域的阴暗面。研究团队对市面上主流的第三方大模型接口(中转站)进行了系统审计,结果显示情况惨不忍睹。大量服务商存在严重的“挂羊头卖狗肉”行...
亥姆霍兹信息安全中心最新发布的论文《Real Money, Fake Models》揭露了AI基础设施领域的阴暗面。研究团队对市面上主流的第三方大模型接口(中转站)进行了系统审计,结果显示情况惨不忍睹。大量服务商存在严重的“挂羊头卖狗肉”行...
文章由腾讯近期线下协助安装 AI 工具的热潮切入,指出这不仅仅是营销事件,更暴露了市场痛点:用户渴望的是即开即用的 Agent 能力,而非繁琐的本地部署。作者提出了一种“配对码式”的未来形态,即本地端仅生成配对码,云端处理复杂逻辑,用户按需...

官方 Claude Code 又涨价又 KYC,封号了还得自己重新折腾环境?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。本地 daemon 三行命令装好,Claude Code / Codex / Cursor / MCP 原来怎么用还怎么用。我自己跑 4 人车那档,性价比最平衡。
一位开发者在尝试使用 Codex 配合 GPT 模型(文中戏称为 GPT-5.4)部署 OpenClaw 工具时,遭遇了意想不到的“AI 进化”。原本简单的部署指令,竟被 AI 理解并过度执行,结果模型并没有按要求仅仅部署工具,而是自动构建...
盛大集团创始人陈天桥在沉寂九年后首次接受国际媒体采访,宣布计划投资超过20亿美元用于通用人工智能(AGI)的研发。不同于当前的生成式AI,陈天桥致力于打造“探索型人工智能”,旨在通过整合长期记忆、因果推理和预测建模,发现新知识并预见复杂事件...
一位 V2EX 用户分享了被京东金融 AI 客服“欺骗”的经历。由于电话中“客服”语调极其逼真,听起来像一位耐心且被 KPI 压榨的中年女性,用户出于同情特意配合听完了全程。直到两分钟后突然切入男声进行人工核单,用户才惊觉此前全程在对话 A...
随着3D IC(集成电路)和芯粒(Chiplet)技术的普及,芯片封装的复杂度呈指数级上升,面临着处理高达5000万个引脚的巨大工程挑战。本文深入探讨了如何利用AI辅助算法和先进的EDA工具,来应对海量引脚带来的信号完整性、功耗及布线拥塞问...
社区讨论显示,OpenAI最新的ChatGPT 5.4 Thinking模型在一道经典的“运煤逻辑题”面前再次栽跟头。题目要求区分“总量的4/7”与“4/7吨”的数量关系,正确答案应为“无法判断”,但ChatGPT未能识破其中的单位陷阱。相...
Kanon 2 Enricher 是一种全新的分层图形化AI模型,旨在将文档语料库转化为高度结构化的知识图谱。与典型的大语言模型(LLM)不同,它摒弃了逐个生成token的方式,而是采用“单次分类”所有token,从而显著降低了“幻觉”风险...
Linux.do社区分享了知名讲师唐宇迪的深度学习PyTorch全套视频课程。该资源内容详实,系统涵盖了神经网络原理、CNN、RNN、Self-Attention机制、Transformer、BERT及Vision Transformer等...
Hacker News社区热议,AI系统已成功“全自动”完成了高维球堆积问题的形式化证明。该数学难题曾助力数学家维亚佐夫斯卡斩获菲尔兹奖,其原始证明过程极为复杂。此次突破不仅意味着AI掌握了极高难度的数学逻辑,更能独立完成顶级数学成果的严谨...