分类: agents
-
Apodex-1.0:作为多智能体验证的深入研究
TLDR:Apodex-1.0 作为以验证为中心的智能体系统设计是最有趣的:独立的子智能体进行探索,共享报告池积累证据,验证者智能体审核来自工作智能体轨迹之外的声明。
-
Agent Graph:多 Agent 价值来自于信息流
TLDR:智能体图很有用,因为它将协作视为测试时图问题:选择相关智能体,对他们的答案进行评分,向正确的方向传递消息,并汇集结果。
-
SkillOpt:在权重之外训练流程
TLDR:SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结,rollout 提供证据,优化器建议编辑,验证门只接受真正的改进。
-
LeanMarathon:把长期形式化当成智能体工程
LeanMarathon 把论文级 Lean 形式化变成一个可恢复的多智能体工程系统:蓝图、证明 DAG、受限 worker、reviewer issue 和 CI gate 共同防止长任务漂移。
-
动态工作流程:从提示到运行时
动态工作流将长视野智能体工作重新构建为运行时综合:分割上下文、外部化状态、验证中间输出,并让 harness 携带单个提示无法可靠保存的部分。
-
Pi Agent:容器化与上下文压缩
coding agent 同时需要两个边界:一个控制它们可以做什么的执行边界,以及一个控制它们在长时间工作中可以记住的内容的上下文边界。
-
MAS Conference Papers: 近期多智能体系统论文阅读清单
TLDR:此页面是最近 MAS 论文的排名阅读候选列表,优先考虑协作结构、拓扑设计、运行时效率和验证。
-
超越个体智能:多智能体系统的 LIFE 框架
LIFE 调查很有用,因为它将 LLM 多智能体系统重新构建为一个生命周期:构建个人能力、集成协作、归因故障和发展系统。