TLDR:SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结,rollout 提供证据,优化器建议编辑,验证门只接受真正的改进。
1分钟阅读 · 2026年6月8日
2026 · skill-learning · agent-systems · reading · agents