← 全部文章

分类： agents

Apodex-1.0：作为多智能体验证的深入研究
TLDR：Apodex-1.0 作为以验证为中心的智能体系统设计是最有趣的：独立的子智能体进行探索，共享报告池积累证据，验证者智能体审核来自工作智能体轨迹之外的声明。
1分钟阅读 · 2026年6月9日
2026 · deep-research · agent-systems · reading · agents
Agent Graph：多 Agent 价值来自于信息流
TLDR：智能体图很有用，因为它将协作视为测试时图问题：选择相关智能体，对他们的答案进行评分，向正确的方向传递消息，并汇集结果。
1分钟阅读 · 2026年6月8日
2026 · multi-agent-systems · information-flow · reading · agents
SkillOpt：在权重之外训练流程
TLDR：SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结，rollout 提供证据，优化器建议编辑，验证门只接受真正的改进。
1分钟阅读 · 2026年6月8日
2026 · skill-learning · agent-systems · reading · agents
LeanMarathon：把长期形式化当成智能体工程
LeanMarathon 把论文级 Lean 形式化变成一个可恢复的多智能体工程系统：蓝图、证明 DAG、受限 worker、reviewer issue 和 CI gate 共同防止长任务漂移。
4分钟阅读 · 2026年6月7日
2026 · formal-methods · agent-systems · reading · agents
动态工作流程：从提示到运行时
动态工作流将长视野智能体工作重新构建为运行时综合：分割上下文、外部化状态、验证中间输出，并让 harness 携带单个提示无法可靠保存的部分。
2分钟阅读 · 2026年6月6日
2026 · agent-runtime · workflows · reading · agents
Pi Agent：容器化与上下文压缩
coding agent 同时需要两个边界：一个控制它们可以做什么的执行边界，以及一个控制它们在长时间工作中可以记住的内容的上下文边界。
2分钟阅读 · 2026年6月4日
2026 · pi-agent · agent-runtime · agents · research
MAS Conference Papers: 近期多智能体系统论文阅读清单
TLDR：此页面是最近 MAS 论文的排名阅读候选列表，优先考虑协作结构、拓扑设计、运行时效率和验证。
4分钟阅读 · 2026年6月4日
2026 · multi-agent-systems · paper-list · reading · agents
超越个体智能：多智能体系统的 LIFE 框架
LIFE 调查很有用，因为它将 LLM 多智能体系统重新构建为一个生命周期：构建个人能力、集成协作、归因故障和发展系统。
3分钟阅读 · 2026年6月1日
2026 · multi-agent-systems · agent-systems · reading · agents