月之暗面创始人拆解大模型训练:新版本仅花460万美元

AI资讯
月之暗面创始人拆解大模型训练成本
月之暗面创始人公开拆解大模型训练过程

460 万美元训练一个前沿模型

月之暗面(Moonshot AI)创始人杨植麟近日发布了一段科普视频,详细拆解了大语言模型的训练流程。视频中最引人注目的数字是:开发新版本(Kimi K2)仅花费约 460 万美元。这个数字在动辄数亿美元训练成本的行业背景下显得格外扎眼。

杨植麟在视频中展示了从数据准备、预训练到后训练的完整链路。他特别提到,新模型在编程实战基准测试中表现突出,部分任务得分已逼近甚至超越同期闭源模型。月之暗面将这一成果归因于对训练数据质量和架构效率的持续优化,而非单纯堆算力。

算力军备竞赛的边际收益拐点

460 万美元这个数字之所以引发讨论,是因为它恰好撞上了另一个行业事件:Anthropic 在 IPO 前因巨额算力支出遭遇投资者抵制。一边是头部玩家烧数十亿美元还没看到盈利拐点,另一边是后发者声称用更少的钱追上了性能。这并非意味着小公司会赢——但确实表明”烧钱换领先”模式正在接近边际收益递减的临界点。

杨植麟的公开科普本身也值得注意。大模型公司的创始人很少愿意透露训练成本细节,更不会制作视频讲解内部流程。这种透明度在行业里几乎是前所未有的,它既是对”技术壁垒不可逾越”叙事的有力回击,也是对潜在投资者释放信号:月之暗面的效率足够高,资本利用率值得信赖。

真正值得关注的不是 460 万本身,而是它背后的方法论。如果能用不到 500 万美元训练出逼近第一梯队的模型,那么未来 18 个月,投资者衡量 AI 公司的核心指标将从”你总共花了多少”转向”每美元能买多少智能”。


参考链接