端侧沙箱:英伟达给智能体加了一把锁
智能体在各类任务中越来越能干,但安全问题始终悬在开发者头顶——让AI系统读写本地文件、调用API,意味着一旦出错或被恶意利用,后果可能远超预期。英伟达在Computex 2026上交出了自己的方案:一套围绕DGX Spark桌面工作站构建的本地安全智能体运行环境。
这套方案的核心是一个名为NemoClaw的开源工具链。开发者只需执行一行安装命令,系统就会自动拉取开源模型(默认为Qwen3.6-35B)、智能体框架(支持Hermes Agent和OpenClaw)以及OpenShell安全运行时。OpenShell是一个沙箱化的执行环境,通过访问控制、隐私保护和操作护栏来约束智能体的行为边界。英伟达强调,所有敏感上下文数据都留在设备本地,开发者完全掌控智能体能够访问的资源,同时消除了按token计费的成本压力。
实际效果如何?英伟达提供了四个预构建的智能体应用作为参考:每日个人新闻摘要(通过Telegram定时推送)、软件开发智能体(读取本地项目目录并编写代码,全程无外网访问)、文档红队审查(按严重程度排列风险发现)、以及日程协商助手(自动解析邮件线程并生成日历事件)。
多节点集群:从桌面扩展到400B参数模型
单台DGX Spark配备128GB统一内存,足以运行35B级别的模型。但对于需要更大参数规模的场景,英伟达同步推出了NVIDIA Sync集群助手,支持将2至4台DGX Spark通过ConnectX-7网卡(200Gbps RoCE)组成高带宽集群。两节点可提供256GB统一内存,约覆盖400B参数模型;四节点则达到512GB,足以应对大型MoE模型和多智能体流水线。
在推理性能方面,英伟达公布了一组实测数据:Qwen3.6-35B在vLLM上使用NVFP4量化检查点和多token预测(MTP)优化后,推理速度提升最高达2.6倍。这意味着在本地环境下运行中等规模模型不再需要忍受令人抓狂的延迟。
不过,整套方案的硬件门槛并不低。DGX Spark定价4699美元,搭载Grace Blackwell架构的GB10芯片,拥有20核ARM CPU。对于个人开发者而言,这是一笔不小的投入;但对于需要数据不出本地的企业场景,价格可能反而是次要考量。
本地安全运行时解决了真实痛点,但普及仍需时间
英伟达的这套方案瞄准的是一个真实的矛盾:企业既想用智能体提升效率,又不敢让数据流出内网。OpenShell沙箱从架构层面回应了这一需求——不是在智能体外部套一层监控,而是在运行时层面限制其能力范围。NVIDIA工程师Subhash Ranjan在Devin Desktop发布时提到:”我们的工程师每天在复杂工作流中运行多个智能体,我们很高兴帮助定义它们如何共享上下文。”这一表态侧面印证了英伟达对多智能体安全协同的重视。
但挑战同样明显。NemoClaw目前绑定的默认模型是通义Qwen3.6-35B,对中文开发者而言算是个加分项,但智能体的实际表现高度依赖模型能力和工具链成熟度。OpenShell的安全边界是否足够严格、能否抵御prompt注入等攻击手段,这些都需要更多实际部署的验证。端侧安全智能体是一个方向正确的答案,但距离”开箱即用”可能还差几个迭代周期。
参考链接: