OpenAI 首席科学家最新采访:为何思维链不能公开、首位 AI 实习生将到来、通用 harness

张开发
2026/4/14 0:21:00 15 分钟阅读

分享文章

OpenAI 首席科学家最新采访:为何思维链不能公开、首位 AI 实习生将到来、通用 harness
来源AGI HuntJakub Pachocki 是 OpenAI 现任首席科学家GPT-4、o1、o3 系列模型的主要设计者之一也是历史上最年轻的 IOI国际信息学奥林匹克金牌得主之一。Jacob Effron 和 Jakub Pachocki 对谈现场截图Unsupervised Learning 播客他很少公开接受采访但这一次他在 Redpoint AI 的播客上坐下来聊了将近一个小时。话题包括 AGI 时间线、OpenAI 内部如何跑实验、为什么故意把 chain of thought 藏起来、以及他对 AI 改变科学研究的真实判断。OpenAI 首席科学家 Jakub Pachocki 与 Jacob Effron 对谈节目叫「Unsupervised Learning」主持人 Jacob Effron 是 Redpoint Ventures 的管理合伙人聊的是他「最想问的那些问题」。OpenAI Newsroom 转发了该采访配文称「算力驱动 AI 的每一层而 merettm 正在谈论构建自动化 AI 研究员的进展。」下面是整场对话里核心的内容整理。012026 年 9 月四个月前Jakub 和 OpenAI 团队公开说过一个时间表• 今年 9 月达到「研究实习生级别」的 AI 系统• 2028 年 3 月实现完全自动化的 AI 研究员AGI 时间线从现在到 2028这次他接受采访第一个问题就是四个月过去了还在轨道上吗“ 「我们在 OpenAI 内部现在已经用 Codex 完成了大部分实际编程。编程这件事对大多数人来说已经发生了相当大的变化。我把这视为一个信号说明某些东西是在轨道上的。」另一个让他觉得「进展超预期」的领域是数学和物理。他说过去那套靠数学比赛来衡量模型能力的方法已经快要不够用了。模型已经解决了 IMO 第 6 题进入了「研究级数学」的领域。他们正在把注意力移向「模型在真实世界里有多有用」这个维度。“ 「我们相信模型现在的能力已经足够虽然不是在每个方面都比人聪明但已经足以实质性地改变经济运转方式。我们对此感到非常紧迫。」02什么叫「实习生」Jacob 追问你怎么知道自己到达了那个门槛Jakub 的区分方式倒是很简单明确。AI 实习生 vs 自动化研究员能力边界对比他说「研究实习生」和「完全自动化研究员」的区别在于任务的时间跨度和具体程度。不要指望今年的系统能接受「去提升你的模型能力」或者「去解决对齐问题」这种指令然后自己去干。这今年还做不到。但如果任务足够具体比如「我有一个改进模型的特定想法帮我跑这个实验把这个评估用不同的方式跑一遍」他认为现在已经有了大部分需要的组件。“ 「我认为我们主要需要的只是把这些组件拼在一起。」Karpathy 那篇用这些模型改进自己「小得多的模型」的文章他觉得是对这类工具未来样子的一个预演。03数学是北极星OpenAI 为什么一直盯着数学比赛跑这不是因为数学本身有多重要而是因为数学是验证「模型有没有真的变聪明」的最好工具。可以验证对就是对错就是错可以无限变难还能告诉你模型在「推理」这件事上到底进步了多少。他说这条路线引出了 reasoning 模型的整套方法论。现在这个「北极星」本身快到顶了。数学没有变得没用团队的注意力开始移向更实际的问题模型在真实科研、真实经济活动里到底能做多少事。有个特别的细节是他提到了一个叫「first proofs」的挑战是几位受尊敬的数学家/理论计算机科学家发布的一批未曾发表的研究级问题给模型来解。这个挑战发布时没有提前通知只有一周时间。OpenAI 当时手上正好有一个训练中的模型一位叫 James Lee 的工程师直接开始手动提示那个模型然后发现它真的在解那些题。Jakub 说其中一道题来自他自己博士研究的领域。“ 「看到模型想出了我可能需要一两周才能想到的那些思路而它用了大概一个小时那是一种很奇怪的感受。就像以前看我们的 Dota 机器人用非常有趣的方式下棋感觉有什么魔法在发生……那类东西不应该是无穷尽的。」「而现在这件事发生在了数学上。发生在了我认为真正具有代表性的领域上。这大大增加了我的紧迫感。」04RL 的下一站RL 可验证性谱系从代码/数学到医疗/法律/创意代码和数学是 RL 最好发挥的地方因为验证答案很容易。但医疗、法律、金融呢Jakub 的看法他相当乐观但承认这是「下一个真正的前沿」。问题的本质他认为和「长时间任务」高度重合。想想看一个数学题如果要研究一年那第一天做什么本来就是一个开放性问题。所以「难以验证」和「长时间跨度」这两个难点其实是同一件事。“ 「我们在这些更通用的领域扩展 RL已经看到非常鼓舞人心的迹象。」对于那些问「我们应不应该自己做 RL」的公司他的建议RL 确实是一种数据效率很高的方式让模型专注于某个任务。但还有一种更数据高效的方式那就是上下文学习in-context learning。只要把你的例子、你的指令放进去模型就能学。他的直觉是与其复制目前 OpenAI 的 RL 流程不如先把精力放在搞清楚什么 eval 是对的、积累什么数据未来直接喂进模型上下文效果可能更好。05通用 harness关于「要不要自己搭 harness」他也给了个明确的判断。“ 「harness 的实现在很长一段时间内都不应该成为限制。我们会有更通用的 harness可以被用于各种各样的领域。Codex 其实如果你拿去用在编程以外的地方效果还不错。」他描述的未来图景是AI 应该主动来到你所在的地方而不是让你去迁就它的限制。比如AI 应该出现在 Slack 里接入你的上下文能够学习、能够执行。不是说有这个功能是因为它能做而是说没有这个功能就表示它存在局限。“ 「长期来看AI 应该默认出现在你所在的地方。如果没有那只应该是因为它有了新的能力而不是因为它有局限。」06推理链的秘密这是整场对话里最有深度的部分之一。OpenAI 在发布早期 reasoning 模型时做了一个决定不向用户展示 chain of thought推理链。这个决定有争议也有很多人不理解。Jakub 解释了他当时的主要动机。推理链公开 vs 隐藏哪种更安全核心逻辑是这样的这类 reasoning 模型的推理过程在训练时没有被直接监督不像 ChatGPT 那样被训练成「礼貌、友好」。训练信号只作用于最终输出而不作用于中间推理。这就意味着推理链是模型在没有「表演压力」下真实运行的地方。“ 「这其实是一种非常强大的范式可以用来解读模型在做什么。这和机制可解释性mechanistic interpretability的想法并不太不同后者是分析那些没有被直接监督的模型激活值……但推理链的优势在于它默认是用英文写的所以理解起来容易得多。」他说如果 OpenAI 在产品里展示 chain of thought最终就不可避免地会用它来做训练。而一旦这样做chain of thought 就会开始被「优化」就会开始变成另一种表演而不是模型真实的内部运行。“ 「如果你想长期理解模型的行为但你在扩展的方法却在直接对抗这个目标那你大概不会有什么好结果。」他把让模型拥有「私人空间」这件事视为维持长期可监控性的关键设计。目前的过渡方案是「推理链摘要」但他认为长期解决方案是让模型实时和你对话而不是展示原始推理链。最新版本的 Codex 和推理型 GPT 模型已经在往这个方向走了。07跑几天都没问题多久以后我们会看到模型可以自主工作几天“ 「我认为模型能够自主工作几天的那个阶段并不太远。也许需要用到比现在更多的算力然后能自主产出质量更高的成果。」至于是否需要工程师背景才能有效监督这些运行几天的 agent他觉得对于很多输出你现在就已经不需要太多专业经验了。但如果你想构建更大的东西你仍然需要「整体设计感」需要能判断哪些模块合适、哪些不合适。“ 「我确实预计这种技能需求会发生相当大的转变。」方向是向「设定方向、把控全局」的那种能力。08model scheming 研究Jakub 提到了一项他认为「非常令人兴奋」的跨实验室合作研究Model scheming即在不同训练环境下模型是否会发展出隐藏目标并开始「假装」对齐而值得注意的是这项研究是 OpenAI、Anthropic 和 DeepMind 合作完成的。他们发现chain of thought monitoring 正是这类研究得以进行的关键工具因为它让研究者真正能够检查模型的动机。“ 「这种能力对于研究长期对齐很有帮助。它可能会把我们带向完全不同的缓解方向比如修改预训练数据或者采用接种提示inoculation prompting这类想法。能够理解对于评估这些方法非常有帮助。」09对齐的真正难题Jakub 认为对齐问题的长期挑战本质上是一个泛化问题。在分布内的场景他们大体上能控制模型行为。真正令人担忧的是模型遇到训练时从未见过的情况时会怎样比如面对一个完全不同的处境或者变得比以往任何时候都聪明得多。“ 「值得泛化的价值观是什么当模型陷入非常不同的处境时它会退回到哪些价值观对我来说这是一条让我相当兴奋的研究线索。」他说过去几年他对对齐问题的看法从「这是一个模糊的、难以界定的问题」演变成了「我们可以通过非常具体的技术方案来取得进展」。他的整体判断是乐观。他相信存在一条技术路径能把我们带到一个「极其美好的世界」。但他同样清楚能力时间线在压缩准备时间不多。“ 「我们必须做好准备必要时接受权衡甚至根据我们所看到的放慢发展速度。」10AI 为科学Jakub 对于 AI 驱动科学研究的判断分几个层面。关于架构的问题他认为LLM 加持物理世界和特定领域专用架构比如蛋白质折叠用不同模型并不矛盾。两条路可以并行。“ 「我不认为大型语言模型是训练出最优蛋白质折叠模型的最高效方式尽管它们最终也许会产出最好的模型。」至于哪些科学领域会最快被 AI 改变他没有给出具体答案但他认为关键在于「模型能不能接入现有的生态系统」。那些实验室能够快速改造自身、接纳这些新工具的领域会跑得更快。他描述的图景不是一个「全自动 AI 科学家」独自跑通一切而是“ 「一个非常自然地与 AI 科学家合作的世界这些 AI 科学家正在努力解决一个问题。」AI 驱动设计和创意人类在回路中。11财富的归宿快问快答环节Jakub 被问到作为一个社会我们在哪些事上想得还不够他说的是「财富集中」。“ 「大量脑力工作可以被自动化这件事带来了一些我认为没有明显解决方案的大问题。其中一个是工作和财富集中的问题我猜这需要政策制定者的参与。」他还说了另一件事让人更警觉一些“ 「如果你真的有一个自动化研究实验室一个可以做很多事情的自动化公司它可能会被非常少数的人控制……这些组织如此强大却可能只由几个人组成。如何思考对这类组织的治理是我们作为社会必须面对的新问题。」机器人部分他也提了一句时间线比虚拟 AI 要长但算法上已经有非常有希望的思路了。12OpenAI 的几个阶段OpenAI 四个演变阶段从学术实验室到 AGI 部署他回顾了 OpenAI 的演变2017 年学术实验室追求各种想法还不太相信 scaling。GPT 时代转向买大计算机开始做 scaling science 和基础设施。ChatGPT 时刻他坦言当时预计会是视频/生成式 AI 先爆发没想到是文本对话先跑出来。但这个张力他们其实预见到了你有一个当下很火的产品但你相信它会演变很多。现在他们认为已经开始进入「部署 AGI」的阶段。不是「在所有方面都比人聪明」那种 AGI而是足以「实质性改变经济运转方式」的那种。关于 Codex 和 Anthropic 的 Claude Code 的竞争他也说了真话在 OpenAI 内部编程工具一直是「次要优先级」主要精力放在「未来那件事」上。这就给了专注于此的 Anthropic 一个先手。“ 「我对我们在研究和模型智能侧正在构建的东西非常有信心。我们现在对产品侧加大投入是因为我们相信现在这些东西真正重要了。」13结尾采访的最后他说的是这个“ 「我们刚才谈到的那些问题关于对齐、可监控性我认为它们正在变得非常紧迫。而且这些问题不只是 AI 研究员的问题是政策制定者的问题也是我们所有人需要思考的问题。我很高兴看到一些讨论开始出现但我们需要更多。」58 分钟的对话Jakub 全程干货输出。2026 年 9 月「实习生」正在到来。2028 年 3 月「研究员」即将问世。那些我们以为是十年后的问题终于已经快到门口了◇ ◆ ◇ YouTube 完整视频https://youtu.be/vK1qEF3a3WM️ 播客Unsupervised Learning by Redpoint AI (RedpointAI) Jacob Effronhttps://x.com/jacobeffron/status/2042234897134162077阅读最新前沿科技趋势报告请访问21世纪关键技术研究院的“未来知识库”未来知识库是“21世纪关键技术研究院”建立的在线知识库平台收藏的资料范围包括人工智能、脑科学、互联网、超级智能数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或访问https://wx.zsxq.com/group/454854145828进入。截止到2月28日 ”未来知识库”精选的百部前沿科技趋势报告加入未来知识库全部资料免费阅读和下载牛津未来研究院 《将人工智能安全视为全球公共产品的影响、挑战与研究重点》麦肯锡超级智能机构赋能人们释放人工智能的全部潜力AAAI 2025 关于人工智能研究未来研究报告斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页壳牌2025 能源安全远景报告能源与人工智能57 页盖洛普 牛津幸福研究中心2025 年世界幸福报告260 页Schwab 2025 未来共生以集体社会创新破解重大社会挑战研究报告36 页IMD2024 年全球数字竞争力排名报告跨越数字鸿沟人才培养与数字法治是关键214 页DS 系列专题DeepSeek 技术溯源及前沿探索50 页 ppt联合国人居署2024 全球城市负责任人工智能评估报告利用 AI 构建以人为本的智慧城市86 页TechUK2025 全球复杂多变背景下的英国科技产业战略韧性与增长路径研究报告52 页NAVEX Global2024 年十大风险与合规趋势报告42 页《具身物理交互在机器人 - 机器人及机器人 - 人协作中的应用》122 页2025 - 2035 年人形机器人发展趋势报告 53 页Evaluate Pharma2024 年全球生物制药行业展望报告增长驱动力分析29 页【AAAI2025 教程】基础模型与具身智能体的交汇350 页 pptTracxn2025 全球飞行汽车行业市场研究报告45 页谷歌2024 人工智能短跑选手AI Sprinters捕捉新兴市场 AI 经济机遇报告39 页【斯坦福博士论文】构建类人化具身智能体从人类行为中学习《基于传感器的机器学习车辆分类》最新 170 页美国安全与新兴技术中心2025 CSET 对美国人工智能行动计划的建议18 页罗兰贝格2024 人形机器人的崛起从科幻到现实如何参与潜在变革研究报告11 页兰德公司2025 从研究到现实NHS 的研究和创新是实现十年计划的关键报告209 页康桥汇世Cambridge Associates2025 年全球经济展望报告44 页国际能源署2025 迈向核能新时代麦肯锡人工智能现状组织如何重塑自身以获取价值威立Wiley2025 全球科研人员人工智能研究报告38 页牛津经济研究院2025 TikTok 对美国就业的量化影响研究报告470 万岗位14 页国际能源署IEA能效 2024 研究报告127 页Workday 2025 发挥人类潜能人工智能AI技能革命研究报告20 页CertiKHack3D2024 年 Web3.0 安全报告28 页世界经济论坛工业制造中的前沿技术人工智能代理的崛起》报告迈向推理时代大型语言模型的长链推理研究综述波士顿咨询2025 亚太地区生成式 AI 的崛起研究报告从技术追赶者到全球领导者的跨越15 页安联Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告33 页IMT2025 具身智能Embodied AI概念、核心要素及未来进展趋势与挑战研究报告25 页IEEE2025 具身智能Embodied AI综述从模拟器到研究任务的调查分析报告15 页CCAV2025 当 AI 接管方向盘自动驾驶场景下的人机交互认知重构、变革及对策研究报告124 页《强化学习自我博弈方法在兵棋推演分析与开发中的应用》最新 132 页《面向科学发现的智能体人工智能进展、挑战与未来方向综述》全国机器人标准化技术委员会人形机器人标准化白皮书2024 版96 页美国国家科学委员会NSB2024 年研究与发展 - 美国趋势及国际比较51 页艾昆纬IQVIA2025 骨科手术机器人技术的崛起白皮书创新及未来方向17 页NPLBeauhurst2025 英国量子产业洞察报告私人和公共投资的作用25 页IEA PVPS2024 光伏系统经济与技术关键绩效指标KPI使用最佳实践指南65 页AGI 智能时代2025 让 DeepSeek 更有趣更有深度的思考研究分析报告24 页2025 军事领域人工智能应用场景、国内外军事人工智能发展现状及未来趋势分析报告37 页华为2025 鸿蒙生态应用开发白皮书133 页《超级智能战略研究报告》中美技术差距分析报告 2025欧洲量子产业联盟QuIC2024 年全球量子技术专利态势分析白皮书34 页美国能源部2021 超级高铁技术Hyperloop对电网和交通能源的影响研究报告60 页罗马大学2025 超级高铁Hyperloop第五种新型交通方式 - 技术研发进展、优势及局限性研究报告72 页兰德公司2025 灾难性网络风险保险研究报告市场趋势与政策选择93 页GTI2024 先进感知技术白皮书36 页AAAI2025 人工智能研究的未来报告17 大关键议题88 页安联 Allianz2025 新势力崛起全球芯片战争与半导体产业格局重构研究报告威达信2025 全球洪水风险研究报告现状、趋势及应对措施22 页兰德公司迈向人工智能治理研究报告2024EqualAI 峰会洞察及建议19 页哈佛商业评论2025 人工智能时代下的现代软件开发实践报告12 页德安华全球航空航天、国防及政府服务研究报告2024 年回顾及 2025 年展望27 页奥雅纳2024 塑造超级高铁Hyperloop的未来监管如何推动发展与创新研究报告28 页HSOAC2025 美国新兴技术与风险评估报告太空领域和关键基础设施24 页Dealroom2025 欧洲经济与科技创新发展态势、挑战及策略研究报告76 页《无人机辅助的天空地一体化网络学习算法技术综述》谷歌云Google Cloud2025 年 AI 商业趋势白皮书49 页《新兴技术与风险分析太空领域与关键基础设施》最新报告150 页《DeepSeek 大模型生态报告》军事人工智能行业研究报告技术奇点驱动应用加速智能化重塑现代战争形态 - 25030940 页真格基金2024 美国独角兽观察报告56 页璞跃Plug and Play2025 未来商业研究报告六大趋势分析67 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页国际电工委员会IEC2025 智能水电技术与市场展望报告90 页RWS2025 智驭 AI 冲击波人机协作的未来研究报告39 页未来今日研究所 2025 年科技趋势报告第 18 版 1000 页模拟真实世界多模态生成模型的统一综述中国信息协会低空经济分会低空经济发展报告2024 - 2025117 页浙江大学2025 语言解码双生花人类经验与 AI 算法的镜像之旅42 页人形机器人行业由 “外” 到 “内” 智能革命 - 25030651 页大成2025 年全球人工智能趋势报告关键法律问题28 页北京大学2025 年 DeepSeek 原理和落地应用报告57 页欧盟委员会 人工智能与未来工作研究报告加州大学伯克利分校面向科学发现的多模态基础模型在化学、材料和生物学中的应用电子行业从柔性传感到人形机器人触觉革命 - 25022635 页RT 轨道交通2024 年中国城市轨道交通市场数据报告188 页FastMoss2024 年度 TikTok 生态发展白皮书122 页Check Point2025 年网络安全报告 - 主要威胁、新兴趋势和 CISO 建议57 页【AAAI2025 教程】评估大型语言模型挑战与方法199 页 ppt《21 世纪美国的主导地位核聚变》最新报告沃尔特基金会Volta Foundation2024 年全球电池行业年度报告518 页斯坦福2025 斯坦福新兴技术评论十项关键技术及其政策影响分析报告191 页国际科学理事会2025 为人工智能做好国家研究生态系统的准备 - 2025 年战略与进展报告英文版118 页光子盒2025 全球量子计算产业发展展望报告184 页奥纬论坛2025 塑造未来的城市研究报告全球 1500 个城市的商业吸引力指数排名124 页Future Matters2024 新兴技术与经济韧性日本未来发展路径前瞻报告17 页《人类与人工智能协作的科学与艺术》284 页博士论文《论多智能体决策的复杂性从博弈学习到部分监控》115 页《2025 年技术展望》56 页 slides大语言模型在多智能体自动驾驶系统中的应用近期进展综述【牛津大学博士论文】不确定性量化与因果考量在非策略决策制定中的应用皮尤研究中心2024 美国民众对气候变化及应对政策的态度调研报告气候政策对美国经济影响的多元观点审视28 页空间计算行业深度发展趋势、关键技术、行业应用及相关公司深度梳理 - 25022433 页Gartner2025 网络安全中的 AI明确战略方向研究报告16 页北京大学2025 年 DeepSeek 系列报告 - 提示词工程和落地场景86 页北京大学2025 年 DeepSeek 系列报告 - DeepSeek 与 AIGC 应用99 页CIC 工信安全2024 全球人工智能立法的主要模式、各国实践及发展趋势研究报告42 页中科闻歌2025 年人工智能技术发展与应用探索报告61 页AGI 智能时代2025 年 Grok - 3 大模型技术突破与未来展望报告28 页上下滑动查看更多

更多文章