标签文章 skill-learning

SkillOpt：在权重之外训练流程
TLDR：SkillOpt 将智能体 skill 视为可优化的文本产物。模型保持冻结，rollout 提供证据，优化器建议编辑，验证门只接受真正的改进。
1分钟阅读 · 2026年6月8日
2026 · skill-learning · agent-systems · reading · agents