分类: agents
-
Codex 源码阅读(VI):上下文工程
Codex 上下文是一个托管的运行时表面:AGENTS.md、skill、线程历史、压缩和运行时设置都有所有权规则,长任务才不会中途断掉。
-
Codex 源码阅读(V):安全模型
Codex 安全模型是一组分层执行边界:沙箱定义技术上能做什么,审批决定哪些操作要审查,执行策略给命令风险分类,操作系统后端负责强制执行。
-
Codex 源码阅读(IV):工具运行时
Codex 工具不是孤立函数,而是由策略绑定运行时支撑的模型可见接口。shell 命令、补丁、MCP、skill、权限、沙箱、流事件和历史记录都走同一条托管执行路径。
-
Self-Harness:会改进自己的 harness
Self-Harness 更适合理解为证据驱动的 harness 版本控制:挖掘失败轨迹,提出有边界的 harness 编辑,只提升能通过回归测试的改动。
-
Codex 源码阅读(I):agentic loop 是运行时边界
TLDR:Codex 的 turn 不是一次模型调用,而是一个托管执行窗口。用户输入、工具调用、工具结果、取消、压缩和最终答案都由运行时排序。
-
Codex 源码阅读(II):Goal 是运行时状态,不是提示词
TLDR:Codex Goal 是线程级的长期任务状态机。它保存目标、状态、预算、使用量、恢复状态和延续门,而不是靠模型记住一段提示词。
-
Codex 源码阅读(III):子智能体是一棵线程树
TLDR:Codex 子智能体不是后台模型调用,而是持久子线程。它有身份、继承的运行时策略、分叉上下文、邮箱通信、容量限制和恢复行为。
-
RLM:递归语言模型
TLDR:RLM 的真正见解不是“递归”这个口号,而是把长上下文移出 Transformer 窗口,放进模型可以检查、切片、搜索和委托的外部环境。