
谷歌在 I/O 大会上拿出了一块新的边缘开发板,主打的卖点是「不联网也能跑 Gemma 3」。谷歌官方在开发者公告中写道「让大模型直接住在终端里」,把这块板子的定位说得相当直白。
1 TOPS 算力本地跑 Gemma 3
这块开发板的核心是 1 TOPS 的算力芯片,足以在板上直接跑 Gemma 3 系列的小尺寸版本。包括文本理解、简单视觉识别、语音指令解析在内的多模态推理都可以在不联网的情况下完成,这对车载、工业终端、家庭智能硬件这些数据敏感、网络不稳定的场景非常关键。开发者拿到板子后只需要烧入 Gemma 3 的 ckpt 即可起跑。
瞄准断网与隐私敏感场景
谷歌这次没有走云端调 API 的老路,而是把模型完整下放到边缘。一方面是回应近期越来越紧的合规与数据本地化要求,另一方面也是给智能设备厂商一份可量产的参考方案。边缘开发板的定价被刻意压低,配合 Gemma 3 的开源策略,整套方案的门槛比同类产品更亲民。
边缘大模型真正赢的是合规而不是性能
边缘 AI 这条线,长期被「为什么不直接调云」这个反问压着。但当数据合规成为硬约束时,云端再快都没用。谷歌这块 1 TOPS 板子并不打算和云端模型比性能,它真正解决的是「这台设备里产生的数据,能不能不出门就把活干完」。这一点对工业、车载、医疗厂商的吸引力,比再快多少 token 都大。