AI 日报 · 2026-05-26 Grok V9 万亿参数 Shannon Scaling Wix 裁员

2026-05-26 AI 行业值得关注的事件 24 条，按板块分组。每条都已写成独立文章，点击进入详情。

产品与功能更新

GrokV9模型已正式结束训练

前沿研究

行业展望与社会影响

开源TOP项目

社媒分享

当日观察

第一条主线：万亿参数路线开始把定价当真武器。xAI 把 Grok V9 万亿参数和 Cursor 编程轨迹一起提前放话，跑分还没出来定价已经成了下一道门槛——Anthropic、OpenAI 这一年把 token 单价从 $15 压到 $7 的速度，意味着新模型再不能靠跑分一锤定音。同一天 Wix 砍掉 1100 人 16% 员工、Uber 内部预算告急、微软优步双双在 token 计费上栽跟头，下一阶段大概率回到基础订阅、按量计费、企业包年三档并存的旧定价模型。

第二条主线：理论框架第一次能跟工程能力对上号。斯坦福把 Shannon 信道容量重写进 scaling 推导，给训练数据熵上界与误差下界做了闭式解，被业界视为 Chinchilla 之后第一个真正的理论框架；同时 Apollo Research 与 METR 公布 9 个 inverse scaling 任务，模型越大越差。一边是新理论框架，一边是评测体系开始把 OOD 当强制约束——大模型从“跑分驱动”切换到“理论+OOD 双轨”，对二线模型公司是隐形的能力线。

第三条主线：Agent 工程的边界从“写得动”移到“收得住”。ECC、cmux、airi、taste-skill、FinceptTerminal、gstack 六个 GitHub 项目同时冲进万星档，主线不是新框架而是把记忆、终端、虚拟人、设计规则、金融数据、个人 skill 都往 agent 框架里塞；Microsoft Copilot Skill exfiltration 漏洞、73% CISO 承认 SOC 应付不了 AI Agent、ARC 给 Agent 做零知识凭证——三条线指向同一件事：Agent 不是“能不能跑”，是“非人身份治理”这一层 Okta、CyberArk、HashiCorp 没补完之前，企业级落地永远差一步。

AI 日报 · 2026-05-26