
Andrej Karpathy 在 5 月 19 日深夜通过 X 宣布,将以个人贡献者身份加入 Anthropic 的预训练团队。这是过去两年里 OpenAI 系第三位创始期级别人物落地 Anthropic——前面分别是 Jan Leike(2024 年 5 月)和 John Schulman(2024 年 8 月)。
三家公司履历叠出来的判断力
Karpathy 是 OpenAI 最早的 11 位创始成员之一。2017 年被 Elon Musk 挖到 Tesla 担任 AI 总监,主导 Autopilot 视觉系统从感知模块到 HydraNet 的整套重写。2022 年回 OpenAI 主导 GPT 系列预训练改造。2024 年离职后创办 Eureka Labs,做 zero-to-hero 系列教程——从零写 nanoGPT 的视频在 YouTube 累计播放超过 5000 万次。
这次加入 Anthropic 的具体头衔被明确为预训练团队的”个人贡献者”,不带管理岗。Anthropic CEO Dario Amodei 在被 The Information 问及时确认:”Andrej 不会带团队,他要的是一张能动手写代码的桌子。”一位履历里有过 OpenAI 总监、Tesla 总监的人主动选择回到不带管理负担的研究角色,意味着他认为当前阶段最值钱的产出在代码而不是协调。
预训练这个选择不是常规答案
过去 18 个月行业话题明显倾向后训练阶段——RLHF、Constitutional AI、tool use、agent 编排是热点,预训练被默认为”已经做完的工程问题”。但这恰恰是 Karpathy 长期不认同的判断。他在去年 12 月的一次播客里说过:”预训练远没有结束。我们还没把数据质量、tokenization、长上下文的几何学搞清楚,所有人在搬砖。”
Anthropic 这边的接应也对得上。研究员 Sholto Douglas 在贴文转发时只回了一句:”Andrej 加入预训练是个准确选择,我们在那一层有真正难的工程问题。”预训练团队在 Anthropic 内部代号 Frontiers,承担 Opus 4.x 系列的基础模型训练,据 The Information 早前报道是 40 人左右,比 OpenAI 同方向团队小一个数量级。
OpenAI 系研究人员的方向感
把 Leike、Schulman、Karpathy 三次跳槽放到一起看,三人在 OpenAI 都已经有可观纸面财富,离开不是为了钱。三人公开声明的理由有差异——Leike 谈”安全研究优先级被产品节奏挤压”,Schulman 谈”专注做 alignment”,Karpathy 这次只用了”研发一线”几个字——但都是 OpenAI 走商业化扩张路线后愿意减薪做研究的人。Anthropic 在 2025 年下半年完成的 250 亿美元融资里有相当一部分预算划给了研究团队的多年合同,据 Bloomberg 报道,预训练方向研究员能拿到 4-6 年的限制性股票包,而不是常规 4 年。
这次加入要看 9 个月后的 Opus 5
真正值得观察的不是 Karpathy 加入这件事本身,是 Anthropic 接下来 9 个月里能不能把 OpenAI 系研究人员的累积优势兑现成 Opus 5 的具体能力提升。三位老兵到岗后第一份成果通常会在 6-12 个月内出现,这个时间窗会和 GPT-6、Gemini 4 的发布节奏正面相撞。预训练这层差距如果在 2027 年初没拉开,Karpathy 加入只是一次品牌叙事;拉开了,2025 年底的几次跳槽会被回头看作行业格局重排的关键节点。
参考链接: