云聚 AI Token Plan 满 199 减 35 元
port:80 AI Junkie
AI 重度玩家的工程笔记本
DigitalOcean 开发者云

Google DeepMind 分享的是研究视角迁移

6 min read 阅读(4) #AI Engineer World 2026
#AI Engineer World 2026
目录

Research to Reality with Google DeepMind 这场分享来自 AI Engineer World’s Fair 2026 Day 2 主舞台,讲者是 Benoit Schillings。本文只整理会议内容和分享脉络,不做个人使用心得。

原视频:https://www.youtube.com/watch?v=4sX_He5c4sI(约 01:15:35 开始)

阿里云 OPC 一人公司创业装备库

分享内容

Benoit Schillings 的 Google DeepMind keynote 更像一次研究视角的校准,而不是具体产品发布。分享里他把机器学习放到更长的技术历史里看,重点不是某个单点功能,而是模型可能让人类看到此前看不到的结构。

字幕里有一句很有代表性的表达:有些进步会让人感觉“它一直在我们面前,只是以前看不见”。这句话解释了为什么 Day 2 会围绕 autoresearch 展开。自动研究的价值,不只是让 agent 多跑几次实验,也包括在更大的组合空间里找到人类没有想到的路线。

这类研究视角和普通工程优化不同。普通优化往往从一个已知假设开始,然后让机器验证;自动研究希望系统参与提出假设、选择实验、解释结果。人的角色会从写每一个步骤,变成设计问题、设定评价标准、判断发现是否有意义。

Benoit 的分享给后面的具体技术做了背景铺垫。Han Xiao 的检索实验、GEPA 的 reflective optimization、kernel autoresearch、AI Village 的 policy search,都可以看作这个大问题的局部实现:把可搜索空间交给系统,让系统带回候选发现。

分享结构

这场分享的结构比较清楚:先用 Research to Reality with Google DeepMind 的问题背景引入,再把重点落到 Autoresearch 这条主线。讲者不是只给一个结论,而是把问题、机制、案例和边界分开讲,方便听众判断这个方向能不能进入真实系统。

按内容顺序看,第一层是背景:Benoit Schillings 的 Google DeepMind keynote 更像一次研究视角的校准,而不是具体产品发布。分享里他把机器学习放到更长的技术历史里看,重点不是某个单点功能,而是模型可能让人类看到此前看不到的结构。 第二层是方法或案例:字幕里有一句很有代表性的表达:有些进步会让人感觉“它一直在我们面前,只是以前看不见”。这句话解释了为什么 Day 2 会围绕 autoresearch 展开。自动研究的价值,不只是让 agent 多跑几次实验,也包括在更大的组合空间里找到人类没有想到的路线。 这两层决定了这场分享不是单纯概念介绍,而是在解释为什么这个问题现在变得重要。

第三层是工程约束:这类研究视角和普通工程优化不同。普通优化往往从一个已知假设开始,然后让机器验证;自动研究希望系统参与提出假设、选择实验、解释结果。人的角色会从写每一个步骤,变成设计问题、设定评价标准、判断发现是否有意义。 这部分通常是会议分享里最值得保留的内容,因为它说明方案不是靠一句口号成立,而是靠具体环境、指标、记忆、验证或工具链支撑。

关键细节集中在后半段:Benoit 的分享给后面的具体技术做了背景铺垫。Han Xiao 的检索实验、GEPA 的 reflective optimization、kernel autoresearch、AI Village 的 policy search,都可以看作这个大问题的局部实现:把可搜索空间交给系统,让系统带回候选发现。 这段把分享从背景介绍推进到可检查的技术抓手,也解释了为什么它会被放进 Day 2 的主舞台议程。

会议脉络

这场也隐含一个风险:发现空间越大,验证压力越大。模型进入更大的组合空间时,产出的候选也会更多、更杂、更难判断。没有评估和证据,发现很容易变成幻觉或者噪声。

Google DeepMind 这场的会议价值,在于把 autoresearch 从工具话题拉回研究方法。它提醒听众,自动研究不是让模型替人写报告,而是让实验、观察和假设生成变成可运行的系统。

对 Day 2 主线来说,这场的作用是打开问题空间。后面的分享负责把问题收窄:怎么做检索、怎么做记忆、怎么做实验 trace、怎么做真实世界 eval。大愿景只有落到这些机制上,才会变成工程。

来源说明

本文依据官方日程、YouTube 自动英文字幕和视频时间线整理。长直播中存在等待音乐、主持人口播和少量插播内容,正文只保留对应主舞台分享的有效信息。

未经允许不得转载:80aj » Google DeepMind 分享的是研究视角迁移
阿里云函数计算 一键部署 AI 大模型

Claude Code 合租 · KYC 封号全托管

官方又涨价又 KYC,封号还得自己重新折腾?ReClaude 拼车了解一下——200 / 400 / 800 / 1600 四档随便挑,账号、风控、切换全平台托管,触发风控自动换号不计次。

上车 4 人车 400/月查看四档套餐