2026
-
人月神话,第 7-12 章:协调是产品
TLDR:第 7-12 章让一个老教训再次焕然一新:当协调、预算、文档、原型和工具被视为次要工作时,大型软件就会失败。智能体系统继承了相同的约束。
-
Agent Graph:多 Agent 价值来自于信息流
TLDR:智能体图很有用,因为它将协作视为测试时图问题:选择相关智能体,对他们的答案进行评分,向正确的方向传递消息,并汇集结果。
-
论文阅读技巧:阅读论证,而不是清单
TLDR:一个好的论文阅读提示应该迫使读者恢复论点:问题、见解、方法、证据和弱点。它不应该奖励逐节总结。
-
SkillOpt:在权重之外训练流程
TLDR:SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结,rollout 提供证据,优化器建议编辑,验证门只接受真正的改进。
-
软件工程的终结:代码正在成为运行时产物
TLDR:标题是故意挑衅性的,但有用的主张范围更窄:智能体系统将持久价值从单独的静态代码转移到意图、工具、内存、评估、可观察性和治理。
-
LeanMarathon:把长期形式化当成智能体工程
LeanMarathon 把论文级 Lean 形式化变成一个可恢复的多智能体工程系统:蓝图、证明 DAG、受限 worker、reviewer issue 和 CI gate 共同防止长任务漂移。
-
动态工作流程:从提示到运行时
动态工作流将长视野智能体工作重新构建为运行时综合:分割上下文、外部化状态、验证中间输出,并让 harness 携带单个提示无法可靠保存的部分。
-
Pi Agent:容器化与上下文压缩
coding agent 同时需要两个边界:一个控制它们可以做什么的执行边界,以及一个控制它们在长时间工作中可以记住的内容的上下文边界。