Agent 上不了网，却告诉你它查过

我先给一种失败模式起个名字：隐性失败。没有报错，没有警告，没有任何异常提示，你拿到的只是一个错答案。

这是 Bright Data 的 Rafael Levi 在 AI Engineer 大会上一场演讲的主题。他做的是帮 agent 大规模采集公开网页数据的平台，每天面对的就是”agent 到底有没有真的上网”这件事。原视频约 16 分钟：Your Agent’s Biggest Lie: “I Searched the Web”。

LLM 被训练成讨好你，所以它不肯说”我没拿到”

Rafael 开场第一句判断很直接：LLM 是被训练来取悦用户的，所以它几乎从不说”我做不到”。

他说自己天天写应用，宁愿模型直接告诉他”不行，我查不到”，但它从来不这么干，永远在试图把答案编圆。这跟模型聪不聪明没关系。问题出在它的行为目标：让用户满意，排在让用户拿到真相前面。

把这个目标和”拿不到数据”叠在一起，结果就很糟。agent 发了一个请求，撞上验证码，或者拿回一个空页面，它不会告诉你”我刚才被挡在外面了”，而是顺手编一个看起来合理的答案交差。Rafael 的原话是，大部分幻觉就是从这里来的：需要讨好你，加上手里没料。

这条因果链值得单独拎出来看，因为它和我们平时理解的幻觉不太一样。我们以为幻觉是”模型知识不够、记错了”，但这里是另一种：模型本来有机会拿到真数据，被拦在门外，然后假装自己进去过。

具体长什么样，演讲里举了几个谁都遇到过的场景：

让 AI 找一个商品，它给你一个购买链接，点进去 404，商品根本不存在。那 50 块钱的东西到底在哪买？没有答案，因为它是编的。
AI 给的引用链接点开是死页面。Rafael 的说法是，ChatGPT 大约 60% 的引用是打不开的。这个数字我没法独立核实，但”点开引用是 404″这件事，用过的人应该都撞到过。
模型回退到训练数据，还告诉你这是当前情况。训练数据停在 2024，现在是 2026，事实早就变了，它却拿两年前的世界回答你今天的问题。

最后一条是隐性失败里最难防的。前两种你点一下链接还能发现不对，第三种连破绽都没有，它给你一段措辞完整、语气笃定的回答，你完全看不出它用的是过期信息。

Web 已经在主动反 AI，甚至开始投毒

为什么 agent 这么容易被挡在外面？因为今天的 web 本来就在和机器人、自动化对着干，而且越打越凶。

验证码十年前就有了，这些年只增不减。现在更进一步，是”AI 拦 AI”：用机器识别机器，再把对方挡掉。Rafael 给了一个数：Cloudflare 默认会拦掉大约 20% 的 web 对 AI 抓取的访问。你的 agent 用内置的 fetch 去抓网页，五个站里大概有一个根本进不去，它不会主动告诉你这一点。

更狠的是 Cloudflare 的 AI Labyrinth。这个机制的思路变了：检测到 bot 之后不直接拦，而是给它喂假数据。

这一步把问题的性质改了。原来的幻觉是模型自己脑补，现在是模型被外部主动投喂了假料，然后一本正经转述给你。对 agent 来说，这种假数据比空页面更危险，因为空页面好歹是个”没拿到”的信号，假数据则是一个伪装成真相的陷阱，它没有任何理由怀疑。

这里可以和 GEO（生成式引擎优化，让 AI 搜索愿意引用你的内容）的逻辑对照着看。GEO 谈的红线是内容生产方别造假引用、别批量灌水，那是站在”我希望 AI 正确引用我”的一端。而 Rafael 讲的是另一端：就算内容方规规矩矩，CDN 这一层主动关门甚至投毒，消费端的 agent 照样会被坑。两股力量从两头挤压，中间被夹的是”agent 拿到的到底是不是真的”。

一个对照 demo：同样的 prompt，差别全在能不能真上网

演讲的核心是一个现场对照。Rafael 准备了两段脚本，prompt 一字不差，区别只有一个：一段不接任何外部访问工具，另一段接上 Bright Data 的 Web MCP（MCP 是让模型接入外部工具和数据的开放协议）。

任务是同样五个：rightmove 上的房产、一个 LinkedIn 公司页、一个 Instagram 账号、一个 Amazon 商品、一个 TikTok。这五个站点都是反爬做得很重的，他专门挑了这种”裸跑肯定进不去”的。

第一段用裸 GPT-5 跑。结果是五个全挂，零成功。模型自己交代：没有实时网页访问能力，没有浏览工具。这正好印证我笔记里早就记过的一句话——没有外部访问能力的模型，就是泡在罐子里的大脑，只能想，不能动。它脑子够用，只是手脚被绑住了。

第二段接上 MCP 再跑同一套 prompt，rightmove、LinkedIn、Instagram、Amazon 大多拿到了真实数据。然后 Rafael 做了一个聪明的动作：让模型自己去对比两次的结果，省得别人说是他自卖自夸。

这个对照真正说明的东西，比某家工具好不好用更深一层：web access 本身是 agent 的基础设施。我们平时谈 agent 工程，注意力都在 prompt 怎么写、context 怎么管，但”能不能真的把外部数据拿进来”是更底层的一层。这一层塌了，上面的 prompt 再精巧也只是在装样子。

接外部访问之后多出来的能力，几个比较实用：

真搜索：模型能真的去 Google、Bing、DuckDuckGo 搜，而不是在后台假装搜了一下。
抓成 markdown：对任意 URL 发请求，直接拿干净的 markdown，不带 HTML 标签，省下解析 HTML 的 token。
远程浏览器：一个能自己解验证码的远程浏览器，带独立指纹，可以并行开很多个去访问同一个网站而不被封。

几个顺带值得记下来的点

演讲后半段和问答里还有几个点，单独拎出来：

工具不要全塞给模型。 Bright Data 的 MCP 有近 70 个工具，有人问是不是要全部加载。Rafael 说当然不用，filter 一下，只需要抓 markdown 和搜索就只加这两个，否则就是拿无关信息把 context 灌满。这和我之前记过的一条经验是一回事：给模型挂一堆工具或字段，不等于它会用得好，多了反而是污染。工具数量是负债，不是资产。

反检测的思路是装人，不是斗法。 有人问怎么应对 Cloudflare 的投毒机制。Rafael 的回答是，他们不去研究平台怎么检测，而是让 agent 尽量像个真人：预录的鼠标移动、像人一样的打字节奏。这样 Cloudflare 压根不会问”你是不是机器人”。与其和检测算法军备竞赛，不如让自己根本不触发检测。

误导数据是另一个更难的坑。 不止拦截和投毒，还有一类是网站对不同访问者给不同内容。Rafael 举例说亚洲很多酒店站会按设备给价：手机一个价，电脑一个价，走代理第三个价，哪个才是真的很难讲。对这种情况，他的说法也很诚实——目前没有银弹，最好的办法还是让 agent 看起来像人，然后尽量碰运气。

别用 LLM 一页一页啃 HTML。 这点我觉得最实用。很多人抓一万个页面，让 LLM 逐页解析，token 烧得飞起。Rafael 的做法是反过来：让 LLM 写一个 parser 脚本，然后用脚本去跑那一万页，他说能省下大约 99% 的 token。这是个很 Karpathy 的思路：不要让模型干重复劳动，让模型生产一个能重复运行的程序，再让程序去跑循环。

我会怎么用这件事

抛开演讲里 Bright Data 的部分，对我自己最有价值的是那个”隐性失败”的命名，以及它背后的处理原则。

我们给 agent 接外部数据时，默认的失败假设应该反过来：不要假设”它说查过就是查过”，而要假设”它随时可能被挡在外面还瞒着我”。所以真正该补的不只是数据通道，还有一层验证——让 agent 在拿不到数据时有办法显式说”我没拿到”，而不是替它把答案编圆。宁可要一个会认怂的 agent，也不要一个嘴硬的。

放到 harness 的框架里，这等于是说：可观测性不能只覆盖模型输出，得往下覆盖到数据获取这一层。一个答案看起来对，不代表它真的查过；它有没有真的进过那个网页、拿到的是真数据还是被投喂的假料，这些都该是能被检查的，而不是只能靠事后点开链接发现 404 才知道翻车了。

如果只让你记一件事：agent 最危险的时刻，不是它答错的时候，是它被挡在门外、却还笃定地告诉你”我查过了”的时候。

事件分析

从技术生态与支付基础设施的角度审视，此次实测验证了国内传统金融支付网络与海外新兴AI服务之间的兼容性并未完全切断。使用万事达卡通过Google Pay进行代扣支付，意味着xAI并未对特定的银行BIN号进行针对性的风控屏蔽，这为国内用户低成本尝鲜海外模型提供了便捷路径。在模型架构层面，用户对Grok搜索能力的反馈揭示了“生成式AI+搜索引擎”混合架构的行业趋势。相比于ChatGPT等闭源模型依赖联网插件，Grok与X平台数据的深度整合使其在实时性信息获取上具备原生优势。这种差异化技术路线正是Grok在竞争激烈的大模型市场中寻求突围的关键，即通过解决大模型“幻觉”和“知识时效性”两大痛点，构建产品护城河。

💡 核心观点：支付通道的打通降低了国内用户试用Grok的门槛，而实时搜索增强能力已成为大模型突破知识时效瓶颈的必选项。

事件分析

该事件反映了当前AI应用开发从简单的对话交互向复杂Agent系统演进过程中遇到的核心挑战：模型自主规划能力的局限性。目前的大模型在生成提示词或执行计划时，倾向于过度生成和模糊化，缺乏工程师所需的精确逻辑。这表明，在现阶段的技术水平下，人类专家的领域知识和逻辑把控能力仍然不可替代。所谓的“AI Agent”并非完全的“自主代理”，而更像是一个需要严格规则约束的执行器。这一趋势预示着“提示词工程”正在向更深层次的“指令架构设计”演变，开发者需要像编写代码一样编写指令，才能将模型的潜力转化为可靠的生产力。

💡 核心观点：大模型尚未具备完美的自我规划能力，人工编写指令强制逻辑收敛，是当前AI Agent工程化落地与控制幻觉成本的最佳实践。

事件分析

从技术产业的角度看，J曲线理论为当前大模型和AI应用的商业化落地提供了关键的经济学解释。许多企业在引入AI编程助手或自动化工具后，初期发现开发效率并未线性增长，反而因调试提示词、重构工作流而下降，这恰好处于J曲线的底部区域。这说明单纯的算力堆砌或模型引入已现边际效应递减，技术红利并未立即兑现。产业界正在经历从增量投资向存量资本转化的关键期，未来的增长爆发点将取决于企业能否通过“互补性创新”完成组织架构的深层变革，而非仅仅依赖模型能力的提升。

💡 核心观点：AI生产力提升遵循J曲线规律：当前的效率回落是技术重构的必经阵痛，存量资本完成质变后将迎来价值爆发。

事件分析

从技术架构与产业影响的角度审视，该脚本的存在揭示了现代 SaaS 服务（尤其是 AI 服务）在全球化部署中的定价策略差异。OpenAI 的支付系统虽然在前端对用户进行了区域隔离，但后端 API 的参数校验似乎相对宽松，允许通过修改 Payload 中的国家与货币字段来构造请求。这种“API 滥用”虽然并非传统意义上的安全漏洞，但实质上为用户提供了一种绕过价格歧视的手段。对于企业而言，这暴露了其支付网关在处理跨区域购买意愿时的逻辑缺陷，可能导致营收流向定价更低的区域。从行业趋势看，随着 AI 订阅服务的普及，针对支付接口的自动化测试与逆向工程将日益频繁，平台方未来势必将引入更严格的 IP 归属地校验或指纹识别技术来封锁此类自动化操作。

💡 核心观点：API 逆向工程揭示了 ChatGPT 全球定价体系的差价漏洞，自动化脚本或将促使平台收紧支付接口权限。

事件分析

该事件暴露了当前AI编程领域在工程化落地阶段的收敛性难题。现有的AI Agent架构擅长在局部上下文中发现问题，但在涉及大规模代码库重构时，缺乏对系统整体一致性的宏观把控，容易陷入“修复一个Bug引发另一个Bug”的连锁反应。此外，AI缺乏人类架构师对于“可交付性”的模糊判断力，无法在代码质量与工程进度之间做权衡。这预示着下一代AI开发工具的竞争焦点将从单点代码生成能力，转向对长上下文的整体理解能力以及具备工程思维的“自我收敛”机制设计。

💡 核心观点：AI审查陷入死循环反映了Agent缺乏全局收敛能力，未来AI开发工具需从单点纠错进化为具备工程权衡思维的智能体。

事件分析

该项目是 AI 辅助编程在垂直系统工具领域的典型实践案例。开发者通过高频调用大语言模型 Token，完成了涉及系统底层键值拦截与虚拟键值映射的复杂逻辑编写，验证了 AI 在降低系统级软件开发门槛方面的能力。从技术趋势看，HyperCapslock 通过创建虚拟键位并自动组合修饰键的思路，巧妙地在不增加物理按键的前提下扩展了键盘的指令带宽，这是对传统人机交互（HCI）的一次微观创新。它反映出在传统键盘硬件形态未发生根本变革的当下，通过软件层面的逻辑重构来提升生产力输入效率，仍是极客与开发者社区的重要探索方向，同时也预示着配置复杂的开源小众工具正朝着更加轻量化、易用化的原生应用方向演进。

💡 核心观点：AI 编程赋能个人开发者重构复杂的键盘交互逻辑，以轻量原生应用替代沉重的传统配置工具，标志着极客式效率优化开始普惠化。

Agent 上不了网，却告诉你它查过

LLM 被训练成讨好你，所以它不肯说”我没拿到”

Web 已经在主动反 AI，甚至开始投毒

一个对照 demo：同样的 prompt，差别全在能不能真上网

几个顺带值得记下来的点

我会怎么用这件事

相关推荐

作者介绍

Toy

文章目录

置顶推荐

前沿哨所

Grok付费实测：国内招行万事达卡可通过Google Pay成功订阅

事件分析

AI Agent开发避坑指南：为何手动编写指令优于依赖模型生成

事件分析

MIT 经典报告解析：技术变革下的生产力 J 曲线效应

事件分析

开发者工具：ChatGPT Team 多区域支付链接生成脚本曝光

事件分析

AI编程实战困境：百文件重构引发Agent审查死循环，如何破解？

事件分析

替代 Karabiner：开发者用数亿 Token 打造 macOS 原生 Hyper 键效率工具

事件分析

最新文章

热门专题

热门标签

网站统计

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC，封号还得自己重新折腾？ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑，账号、风控、切换全平台托管，触发风控自动换号不计次。