标签文章 research-methods
-
论文阅读技巧:阅读论证,而不是清单
TLDR:一个好的论文阅读提示应该迫使读者恢复论点:问题、见解、方法、证据和弱点。它不应该奖励逐节总结。
-
田远东谈:搜索质量就是动作空间质量
TLDR:更多 rollout 还不够。只有当动作空间、表示、评估器和记忆让好轨迹更容易被找到时,搜索才会真正变强。
-
对话姚舜宇:反馈是 AI 研究的中心
TLDR:这次对话很有用,因为它将人工智能研究框架为系统驱动的实验工作:定义可验证的问题,建立反馈循环,仔细调试,并选择仍在塑造扩展路径的方向。