Claude Code推出工作流控制功能,Karpathy推荐

AI资讯

Claude Code 的动态工作流:让 AI 自己写自己的执行脚本

Anthropic 上周为 Claude Code 推出了动态工作流(Dynamic Workflows)功能。Claude 现在可以在运行时自动编写 JavaScript 执行脚本,针对具体任务定制专属的 agent 编排方案。Andrej Karpathy 在社交平台上公开推荐了这一功能,称其为 Claude Code 使用方式的”质变”。

Claude Code 动态工作流功能示意图
Claude Code 动态工作流支持多 agent 编排

此前用户需要通过 Claude Agent SDK 或命令行手动编排多个 Claude 实例的协作流程。动态工作流把这个编排过程本身也交给了 AI:Claude 根据任务描述自行决定如何拆分工作、分配子 agent、设定验证步骤,并生成对应的 JavaScript 文件来执行整个流程。

用架构对抗 AI 的懒惰和偏见

根据 Karpathy 的详细评测文章,动态工作流的设计初衷是解决长任务中 Claude 的三个典型失败模式:代理惰性(做到一半就宣告完成)、自我偏好偏差(倾向于认可自己的输出)、目标漂移(经过多轮压缩后偏离原始要求)。解决方案是为每个子任务启动独立的 Claude 实例,各自拥有干净的上下文窗口和聚焦的目标。

Karpathy 列举了多种编排模式:分类-路由模式用于先判断任务类型再分派;扇出-综合模式将大任务拆成多个并行子任务再汇总;对抗验证模式为每个 agent 配备独立的审查 agent;锦标赛模式让多个 agent 竞争同一任务再由评审 agent 逐一淘汰。他特别提到,工作流在非技术场景中同样有效,例如从 Slack 历史记录中挖掘未解决的技术根因,或对商业计划书进行多角度压力测试。

Karpathy 在文章末尾也给出了务实的提醒:工作流会消耗更多 token,不适合所有任务。大多数常规编码工作并不需要一个五人评审团。把它用在真正需要结构化对抗或多路并行的复杂场景中,才能发挥最大价值。


参考链接