标签文章 agent-systems
-
RLM:递归语言模型
TLDR:RLM 的真正见解不是“递归”这个口号,而是把长上下文移出 Transformer 窗口,放进模型可以检查、切片、搜索和委托的外部环境。
-
Apodex-1.0:作为多智能体验证的深入研究
TLDR:Apodex-1.0 作为以验证为中心的智能体系统设计是最有趣的:独立的子智能体进行探索,共享报告池积累证据,验证者智能体审核来自工作智能体轨迹之外的声明。
-
SkillOpt:在权重之外训练流程
TLDR:SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结,rollout 提供证据,优化器建议编辑,验证门只接受真正的改进。
-
LeanMarathon:把长期形式化当成智能体工程
LeanMarathon 把论文级 Lean 形式化变成一个可恢复的多智能体工程系统:蓝图、证明 DAG、受限 worker、reviewer issue 和 CI gate 共同防止长任务漂移。
-
超越个体智能:多智能体系统的 LIFE 框架
LIFE 调查很有用,因为它将 LLM 多智能体系统重新构建为一个生命周期:构建个人能力、集成协作、归因故障和发展系统。
-
对话姚舜宇:反馈是 AI 研究的中心
TLDR:这次对话很有用,因为它将人工智能研究框架为系统驱动的实验工作:定义可验证的问题,建立反馈循环,仔细调试,并选择仍在塑造扩展路径的方向。