← 全部文章 · 标签云

标签文章 agent-systems

RLM：递归语言模型
TLDR：RLM 的真正见解不是“递归”这个口号，而是把长上下文移出 Transformer 窗口，放进模型可以检查、切片、搜索和委托的外部环境。
1分钟阅读 · 2026年6月10日
2026 · recursive-language-model · agent-systems · reading · agents
Apodex-1.0：作为多智能体验证的深入研究
TLDR：Apodex-1.0 作为以验证为中心的智能体系统设计是最有趣的：独立的子智能体进行探索，共享报告池积累证据，验证者智能体审核来自工作智能体轨迹之外的声明。
1分钟阅读 · 2026年6月9日
2026 · deep-research · agent-systems · reading · agents
SkillOpt：在权重之外训练流程
TLDR：SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结，rollout 提供证据，优化器建议编辑，验证门只接受真正的改进。
1分钟阅读 · 2026年6月8日
2026 · skill-learning · agent-systems · reading · agents
LeanMarathon：把长期形式化当成智能体工程
LeanMarathon 把论文级 Lean 形式化变成一个可恢复的多智能体工程系统：蓝图、证明 DAG、受限 worker、reviewer issue 和 CI gate 共同防止长任务漂移。
4分钟阅读 · 2026年6月7日
2026 · formal-methods · agent-systems · reading · agents
超越个体智能：多智能体系统的 LIFE 框架
LIFE 调查很有用，因为它将 LLM 多智能体系统重新构建为一个生命周期：构建个人能力、集成协作、归因故障和发展系统。
3分钟阅读 · 2026年6月1日
2026 · multi-agent-systems · agent-systems · reading · agents
对话姚舜宇：反馈是 AI 研究的中心
TLDR：这次对话很有用，因为它将人工智能研究框架为系统驱动的实验工作：定义可验证的问题，建立反馈循环，仔细调试，并选择仍在塑造扩展路径的方向。
1分钟阅读 · 2026年5月14日
2026 · research-methods · agent-systems · reading · research

标签文章 agent-systems

RLM：递归语言模型

Apodex-1.0：作为多智能体验证的深入研究

SkillOpt：在权重之外训练流程

LeanMarathon：把长期形式化当成智能体工程

超越个体智能：多智能体系统的 LIFE 框架

对话姚舜宇：反馈是 AI 研究的中心