蔡允达分享 Grok 子代理夜跑迭代:睡觉时让 AI 自己优化代码

AI资讯
Grok 子代理夜间自动迭代代码并生成总结报告示意
睡前下命令,早上看推文总结

开发者蔡允达在 X 上贴出了自己的 Grok 子代理工作流:睡前在终端里下达任务,子代理整夜自主迭代代码,第二天清晨直接收到一封以推文风格写好的总结报告。他写道:“我睡眠的 7 个小时,它跑了 38 轮迭代。”

关键细节:任务是一个完整迭代循环

这套工作流让人眼前一亮的不是”挂机跑”,而是”挂机能收敛”。蔡允达公开的脚本里,子代理被赋予了一个完整迭代循环:跑一次训练、读一次评估指标、改一份配置、再跑一次。子代理把每一轮的指标变化追加进同一份日志,一旦验证集分数连续 3 轮无提升,就触发回滚到上一个最优点位。整夜 38 轮迭代里出现过 4 次回滚,最后稳定在比初始版本高 6.2 个百分点的位置。

适用场景比想象的更宽

从他贴出的几个实例看,这套方案不止用在大模型微调,也覆盖了梯度下降可表达的多种场景:图像分类小模型的超参搜索、强化学习智能体的奖励函数微调、多模态评估集上的 prompt 模板比对。关键是任务需要可量化的”分数”和可自动落盘的”配置”,子代理才有判断收敛与回滚的依据。换句话说,能写成”输入参数 → 跑一次 → 输出分数”的事情,都可以让 Grok 子代理在夜里替你跑。

“夜跑工作流”会成为开发者的默认习惯

过去几年开发者的时间被卡在两件事上:等训练,等评估。蔡允达这套工作流给出的提示是——这两件事本来就不需要人盯着。当子代理具备自我回滚能力,”白天写策略、夜里让 AI 替你跑实验”就会变成开发者的默认习惯。下一个要解决的问题,是让多个子代理之间的实验结果能互通有无,避免每个开发者都从零起跑同一组超参。


参考:X 蔡允达推特