云聚 AI Token Plan 满 199 减 35 元
port:80 AI Junkie
AI 重度玩家的工程笔记本
DigitalOcean 开发者云

给 AI 设一个美联储

云聚 AI Token Plan 满 199 减 35 元

上周五,美国政府做了一件很反常的事:它逼着本国最领先的一家 AI 公司,把最先进的产品从市场上撤下来。首当其冲的是 Anthropic,它的前沿模型叫 Mythos,对外卖的那个版本叫 Fable。据报道,留给公司执行的时间,大约只有九十分钟。

这条新闻你大概率没注意到,正常。它发生在政府从伊朗战事抽身的阴影里,被更吵的头条盖住了。但拉长时间看,它可能比那场仗更要紧。因为华盛顿和 Anthropic 这一架,根本不是冲着哪一家公司去的。它是关于「谁来治理人工智能」的第一场摆上台面的较量,以及这种治理到底会通过规则和制度来落地,还是靠临场发挥和赤裸裸的权力。

阿里云 OPC 一人公司创业装备库

让华盛顿恐慌的,是一次几小时的演示

要看懂政府为什么这么急,得先知道它怕的是什么。

参议员马克·华纳最近转述了一份证词。作证的是约书亚·拉德将军,他同时执掌国家安全局和网络司令部。证词说:Anthropic 那个最先进的 Mythos,能攻破政府几乎所有的涉密系统。不是几周,也不是几天,是几个小时。

到这一步,「AI 要不要管」已经不值得再争。真正的问题只剩一个:怎么管。

政府的应对,自相矛盾

接下来的操作就开始拧巴了。

两周半以前,特朗普刚签了一道行政令,给前沿 AI 模型设了一个自愿审查流程,还给各部门 60 天,去设计一套识别高风险系统的框架。这个方向其实是对的:有结构的监督、提前测试、清楚的门槛。

可这套流程还没建起来,五角大楼就先一步把 Anthropic 定成了「供应链风险」,政府一度要求各联邦部门停用它的系统。然后才有了上周那道九十分钟的最后通牒。

平心而论,政府的担忧不是无理取闹。Anthropic 确实犯过实打实的错。《华盛顿邮报》报道说,它把 Mythos 的访问权限放得比官方批准的还宽,而且在「到底谁能用」这件事上,回应得太慢。情报部门更倾向于强硬处置。

==但这恰恰说明流程有多重要。== 当一项技术变得这么关键,决定就不能靠某一派在周末的官僚混战里赢一把来拍板,更不能下个周末又被另一派推翻。

那道九十分钟的命令,表面是对一家公司,实际是在对全世界喊话:如果你的经济开始依赖美国的 AI 基础设施,华盛顿可以不打招呼、不给解释,随时按下那个开关。

更麻烦的是,这种「针对个体、随意、不可预期」的做法,几乎成了这届政府对待商业的固定姿势。它不去设一套所有人都能照着玩的规则,而是直接下场:在英特尔里拿一块股份,逼英伟达交一笔特别的「税」,在美国钢铁里捏一份黄金股,很多时候法律依据都不清楚。这不是一个全球最发达的资本主义国家该有的治理方式。

中间还夹着私人恩怨。在跟五角大楼最初那场冲突里,国防部长指责 Anthropic「背叛」和「两面派」;高层官员反复批评这家公司「woke」、雇了太多民主党人;总统本人也公开嘲讽过它。AI 这么要紧的东西,不该拿来算这种私账。

给 AI 设一个美联储

骂完了,得给正解。Fareed 给的方案,根植于一个美国人自己发明、并且运转得极好的东西:美联储。

银行对资本主义至关重要,它供给的资本是整个经济的命脉。可银行业天生爱出危机,一出就是大事。于是美国造了制度来兜底。美联储是美国最伟大的制度发明之一,原因在于它把公共权威和私营专业拧在了一起:它一刻不停地和市场沟通,同时保住自己的独立性;它做检查、跑压力测试、定资本金要求、发指引,出手的时候是分级的,不是一刀切。最关键的,它的规则对所有人一视同仁。

先进 AI 需要的,差不多就是这套东西。我们应该建一个「AI 美联储」:一个独立机构,配齐懂技术、懂国家安全、懂商业的专家。它会要求前沿开发者在模型发布前先交出来做评估;为危险能力设下透明的门槛;建一道阶梯式的响应机制——先警告,再要求整改,再有条件部署,再限制,而不是动不动就突然封杀;并且让这些规则对每个玩家都一样。

美国该带头建这套系统。欧洲和日本可以建平行的机构。各个民主国家要像央行协调金融稳定那样,去协调 AI 的标准。

这不是要给创新踩刹车。美国的银行能横扫全球,恰恰是因为它们被管得好,而不是因为没人管。==没有制度托底的速度,不是活力,是危险的剧烈波动。==

油门有了,刹车呢

节目后半段,Anthropic 又出了条新闻,正好接上这个话题。

Anthropic 研究院说,AI 的发展比一些人预想的要快,人越来越用不上了,因为 AI 正在逼近一件事:自己写代码,造出更高级的自己。他们因此建议,世界最好保留一个「踩慢或临时暂停前沿 AI」的选项,好让社会结构和对齐研究跟上技术的脚步。但他们也补了一句:如果一停下来,反而让最不谨慎的玩家追了上来,那所有人都会更不安全。这件事得靠多个国家的 AI 实验室,在同样的条件下一起停才行。

联合创始人杰克·克拉克上了节目。主持人请他解释那个吓人的词——「递归自我改进」。

克拉克说,AI 行业最初的目标,就是造出聪明到能当一个通用科学家的系统,让它去做科学发现,而其中一项发现,就是「怎么造出更好的 AI」。他认为现在很可能就站在这个临界点上,而且这一天来的时间,可能是几年,不是几十年,比大多数人预想的早得多。

好处是巨大的。今天要用 AI 在生物、医药、机器人上做点事,得把数字世界里的 AI 系统硬适配到复杂的现实里,靠科学家一对一去配。而一个能改进自己的 AI,可以自己钻进医药、生物这些领域,自己琢磨要变得更强需要什么,再和人协作。科学可能因此猛地加速,AI 会从「科学家手里的工具」,变成「会创造的合作科学家」。

风险也在这儿。主持人半开玩笑说,科幻电影里我们把控制权交给机器,结果大家都知道,造它们的人第一个完蛋。克拉克没回避:真正的风险,是==你没法验证、没法核实、没法信任这些系统的行为==。他打了个比方:这就像往你的新闻编辑室里,一下子塞进成百上千个新同事。你得花好长时间才能搞清楚,能不能信他们、他们干活是不是按你预期的来、你交代的事他们办回来的结果对不对。当这支「科学家队伍」比以往任何时候都更庞大、更快,你怎么维持控制?

所以 Anthropic 想要那个「暂停选项」。克拉克的比喻很传神:我们现在开的这辆车,只有油门,没有刹车。总有一天,我们会想要那个踩一脚刹车的选项——把已经造出来的科学成果先推向世界,把脚从「无脑加速 AI」的油门上挪开。

怎么开始?克拉克说,先得有公司站出来说「我想要这个选项」,这样才谈得拢,才能去和别的公司、和政府商量,这种机制到底怎么落地。他还提了一个先例:冷战最紧张的时候,几个互相敌对的国家,也找到了办法,把核军备竞赛的某些环节稳住。这种事在别的领域做成过,AI 这边也许也得来一遍。

我的补充:可验证性,才是这一切的底层

视频里我最在意的,是克拉克那句「没法验证、没法核实、没法信任」。这句话听着像是对递归自我改进的恐惧,但往底下挖,它其实是个老问题。

我之前精读 Karpathy 的方法论时记过一条判断:AI 真正强的地方,都满足三个条件——能反复试错、试错成本几乎为零、机器能自动打分。代码和数学之所以是 AI 的主场,就因为「跑通了 100 分,报错了 0 分」,它知道自己错在哪,于是能自我进化。反过来,凡是没法自动验收的任务,AI 就找不着北。克拉克怕的「信不过的同事」,本质就是==当 AI 强到能改进自己时,我们却拿不出一套能给它打分、判它对错的验收机制==。能力跑在了验证前面。Mythos 几个小时攻穿涉密系统,就是一次能力对验证的碾压。

从这个角度看,Fareed 那个「AI 美联储」其实很聪明。它要求「发布前先交出来评估」「为危险能力设透明门槛」,翻译成工程语言,就是把可验证性从单个公司的自觉,升级成整个行业的制度。一家公司可以靠良心做评估,也可以在断合同的压力下跳过评估;但一套对所有人生效的规则不会。

还有一层值得说。我之前梳理过一个判断:模型层正在被三五家公司压扁、商品化,真正的权力在往基础设施和制度层走。Fareed 警告的那个「随时能按下的开关」,正是这种权力高度集中后的政治表现——当少数几家公司加少数几个政府,攥着一项流进所有人生活的技术,治理就不再是可选项。

所以这件事最大的启示,对我这种做工程和团队的人也成立:靠某一家公司的善意不稳,靠某一届政府的临场判断更不稳。真正靠得住的,是清楚、对所有人平等、并且摆在台面上的规则。从一家公司,到一个行业,再到一个国家,是同一个道理。

油门我们已经踩了很多年。现在该认真想想,刹车装在哪、谁有权踩、按什么规则踩。


原视频:CNN Fareed’s Take,《Why Trump admin gave Anthropic 90 minutes to pull its newest AI model》。在 YouTube 观看

toy

阿里云函数计算 一键部署 AI 大模型
赞(0)
未经允许不得转载:80aj » 给 AI 设一个美联储
ReClaude Claude Code 合租
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐