
5 月 21 日,MIT Technology Review 发出一篇现场报道,标题翻译过来大致是《不管你喜不喜欢,Anthropic 的 Code with Claude 活动展示了编程的未来》。这篇稿子在 Reddit 的 r/artificial 板块顶到 800 多赞,评论区里既有”这波是真的”的兴奋,也有”未读直接合并就是埋雷”的强烈反对。把现场细节、观众反应和厂商内部数据放在一起看,会得到一张相当有冲击力的截图。
现场被记者拎出来的两组硬数据
报道里有两组数据被反复引用。第一组来自 Anthropic 自家:CEO Dario Amodei 在主题演讲中提到,公司内部”绝大部分代码”已经由 Claude 写出来,工程师转向审阅与高层设计。第二组数据来自现场调查,记者在咖啡区随机问了大约 35 位到场开发者,结果接近一半的受访者承认自己最近一周直接合并过未通读的 AI 生成代码。样本量并不大,但放在同一篇报道里就形成了非常直接的画面感——写代码的不读代码,已经从段子变成了行业现状。
参会者并不是一边倒地兴奋
MIT Technology Review 资深编辑 Will Douglas Heaven 在文中引用了一位现场工程师的反应,对方直言”我们正在用 review 时间换 ship 速度,但代价没人算清楚”。Reddit 帖子下高赞回复来自用户 @jakderrida,他写道:”如果连写代码的人自己都不读,那 PR review 就是橡皮图章;出 bug 的时候没人能解释为什么这一行存在。”这种担心并不是抽象的伦理焦虑,而是直接指向责任划分——代码出错时,提交者无法解释设计意图,回滚和定位的成本会指数级上升。
Anthropic 自己的回应是另一套逻辑。Amodei 在演讲中说,公司更看重”模型能否解释自己写的代码”,而不是”人类是否逐行读过”,配套工具会让 AI 自动生成测试、运行回归、给出变更摘要。这套思路在演示环节确实跑通了一个完整的故事:从开 issue、定方案到提交 PR,全程由 Claude Code 主导,工程师只在关键决策点点确认。
把审阅外包给 AI 是危险的赌博
这场活动展示的能力是真的,但被现场气氛遮住的问题也是真的。未读合并和”由 AI 审 AI”在小项目里没事,一旦进入金融、医疗、基础设施这种代码出错有人头落地的领域,没人会接受”我没看,但模型说没问题”——而 Anthropic 内部代码绝大多数由模型生成的前提,本来就是有一支顶级人类工程师团队在做边界设定和回归把关,普通公司直接照搬只会复刻表面、留下隐患。再往后看 Reddit 评论区已经在传”年轻工程师正在失去 review 能力”,这个趋势如果坐实,三五年后行业要付出的代价会比现在节省的人月昂贵得多。Code with Claude 把方向感讲清楚了,但能不能真把这条路走通,比演示视频里看到的要难得多。