名校研究揭示 AI 效率幻觉:实测仅节省 7 秒

AI资讯

人们普遍认为 AI 能大幅节省时间——写邮件、做总结、写代码,一键生成似乎瞬间就能完成。但一项来自多所名校的联合研究给出了截然不同的答案:在受控实验中,AI 辅助完成日常任务仅比手动操作平均快 7 秒,远低于参与者的主观预期。这项被研究者称为”效率幻觉”的发现,正在挑战业界对 AI 生产力价值的评估方式。

三项基准任务还原 AI 的真实时间账本

研究团队设计了三个覆盖日常办公场景的基准任务:撰写一封 100 词左右的工作邮件、将一篇 500 词的行业报告总结为 3 个要点、以及编写一段不超过 30 行的数据处理脚本。共有 120 名具有至少一年 AI 工具使用经验的参与者被随机分为两组,一组借助 ChatGPT、Claude 等工具完成,另一组完全手工操作。每项任务的完成时间由后台精确记录,参与者在每项任务结束后还被要求估计 AI 为他们节省了多少时间。

结果显示,AI 辅助组在全部三项任务中的平均完成时间为 2 分 13 秒,手动组为 2 分 20 秒,差距仅 7 秒。更值得关注的是,近 80% 的参与者高估了 AI 节省的时间——他们平均认为 AI 帮他们省下了至少 2 分钟,与实际 7 秒相差近 17 倍。即使排除了极端值,这一高估偏差依然显著。

提示词摩擦:被忽略的时间黑洞

卡内基梅隆大学人机交互系教授 Jeffrey P. Bigham 在评论中指出,”效率幻觉”的核心成因在于”提示词摩擦”——用户需要花时间构思提示词、调整表达、反复试错。数据显示,AI 辅助组参与者平均花费 12 秒在构思和输入提示词上,另有 8 秒用于检查、修改模型输出。这两项合计 20 秒的非直接产出时间,几乎完全抵消了模型生成文本的速度优势。

研究还发现,即使是对 AI 工具非常熟悉的”高频用户”,其提示词摩擦也并未显著降低。这可能意味着当前以”对话式交互”为主的 AI 接口设计存在结构性低效——用户在精确表达需求和快速获得结果之间存在不可忽视的折中。换句话说,模型”跑得快”并不等于人”做得快”。

AI 与手动操作完成时间对比示意图
研究显示 AI 辅助仅节省约 7 秒,与用户预期差距悬殊。

效率幻觉对 AI 评估体系的启示

研究团队也指出了本次实验的局限性:三项基准任务均为短时、结构化的简单工作,现实中更复杂的多步骤任务——例如撰写长篇技术文档或跨系统数据分析——可能呈现出不同的效率曲线。此外,实验室环境下的操作压力与实际工作环境的干扰因素不同,外部效度有待进一步验证。

从更广的视角看,”AI 效率幻觉”提示了一个重要方向:未来 AI 工具的效率评估不能仅看模型响应速度,而应将用户的”全链路时间”——从意图明确到结果验收——纳入考核。Bigham 教授建议,产品设计应致力于降低提示词摩擦,例如通过模板化输入、上下文智能推测与多模态交互等方式,使 AI 的”快”真正转化为用户的”省”。


参考:论文预印本