跳到正文

对话姚舜宇:反馈是 AI 研究的中心

对话很长,但主线很简单:

AI research is becoming system-driven experimental science.

这并不意味着想法不再重要。这意味着想法越来越需要在数据、基础设施、评估、调试和长反馈循环中生存。如果系统无法判断其是否正常工作,那么美丽的故事是不够的。

从理论到反馈

一个有用的线索是弱反馈领域和强反馈领域之间的对比。

在实验缓慢、稀缺或以社会为媒介的领域,品味和内部共识可以在很长一段时间内占据主导地位。在 AI 中,反馈并不完美,但通常要快得多。您可以运行实验、检查故障、更改数据、调整评估并从结果中学习。

这种速度是吸引力的一部分。它还改变了研究人员的概况。有价值的研究者不仅仅是拥有聪明想法的人。能够使想法变得可测试的人。

为什么编码提前转移

编码是最早获得广泛应用的 AI 原生 app 之一,因为它具有异常良好的反馈:

  • 代码可以被执行;
  • 可以运行测试;
  • 可以审查差异;
  • 故障可以重现;
  • 任务可以分解为具体产物。

这并不会让编码变得容易。它使反馈循环清晰可见。

许多较困难的领域,例如机器人、产品品味、个性化或长期智能体,反馈较弱。奖励是延迟的、模糊的,或者与环境纠缠在一起的。那里的进展取决于建立更好的评估循环,而不仅仅是更大的模型。

单人英雄事迹的终结

另一个重要线索是前沿 AI 研究已经变得更加组织化。

变形金刚时代的突破仍然为个人品味和判断留下了空间,但现代前沿系统取决于:

  • 数据管道;
  • 训练基础设施;
  • 评估套件;
  • 调试文化;
  • 产品反馈;
  • 安全性和可靠性流程; ——分工明确。

个体研究人员仍然很重要,但更像是一个在大型系统中冲浪的人,而不是独自创造整个浪潮的人。

这不是一个浪漫的观点,但却很有用。如果该领域是系统驱动的,那么可靠、仔细且能够闭环就成为研究优势。## 年轻研究人员应该培养什么

我从谈话中得到的实用建议不是“追逐最热门的模特方向”。就是建立将模糊问题转化为实验系统的能力。

有用的问题包括:

What exactly is the task?
Where does the data come from?
What feedback signal is trustworthy?
What would count as failure?
Can the first experiment run this week?
How will I know whether a result is real or a bug?
What should be automated, and what still needs judgment?

这不像命名一个新范式那么迷人,但这就是研究的复合方式。

将 AI 作为研究的一部分

下一个转变是 AI 将越来越多地帮助 AI 研究本身:编码、阅读、实验设置、调试、结果分析、假设生成和文献搜索。

重要的区别在于使用 AI 和与 AI 协作之间。合作意味着研究者仍然拥有问题框架、证据标准和最终判断。模型可以加速工作,但它也应该用作受控循环内的批评者、助手和执行者。

对于长期工作,这又成为一个系统问题。研究人员需要工具、内存、评估和审查点,以便 AI 帮助改善研究循环,而不是增加不可信的输出。

机会依然存在

对话还警告不要假设主要语言模型轨道是唯一的工作场所。

有些方向拥挤且资源密集。其他的定义不明确但可能很重要:

  • 长期智能体;
  • 可靠的工具使用;
  • 个人记忆;
  • 科学 AI;
  • 机器人技术和接地交互;
  • 多模式生成和理解;
  • 机器学习编码和自动化实验。

有吸引力的方向不一定是最响亮的方向。这是可以建立和扩展反馈的地方。

我的收获

最深刻的教训是现代 AI 研究奖励反馈纪律。

优秀的研究人员仍然需要品味、勇气和理论。但日常优势可能来自于一些不那么引人注目的事情:使问题可衡量、构建干净的循环、诚实地调试、良好地使用 AI 以及对结果负责。