Chrome 推出 Prompt API:浏览器原生 AI 时代到来,网页可直接调用 Gemini Nano 本地模型

# Chrome 推出 Prompt API:浏览器原生 AI 时代到来,网页可直接调用 Gemini Nano 本地模型

近日,Google 宣布在 Chrome 浏览器中正式推出 **Prompt API**,允许网页开发者通过 JavaScript 直接调用内置的 **Gemini Nano** 大语言模型。这一举措标志着浏览器从“内容呈现平台”向“AI 推理终端”的关键跃迁,为 Web 应用带来了真正的本地化智能能力。

## 技术原理:浏览器内置的轻量级 AI 引擎

Gemini Nano 是 Google 专为端侧设备优化的轻量级模型,参数量级显著低于云端大模型,但在文本理解、摘要、分类、翻译等常见任务上表现高效。Prompt API 通过 Chrome 的 **WebGPU** 和 **WebNN** 等底层加速接口,将模型推理完全托管在用户本地设备的 GPU 或 NPU 上。开发者只需调用 `window.ai.prompt()` 方法,即可向模型发送文本指令并获取实时响应,无需额外引入第三方 SDK 或搭建后端推理服务。

## 核心优势:隐私、离线与低延迟

与传统的云端 AI 方案相比,Prompt API 具备三大不可替代的价值:

– **数据隐私**:所有用户输入的文本及模型推理均在本地完成,不经过任何外部服务器,彻底规避了数据传输中的隐私泄露风险。
– **离线可用**:模型权重随 Chrome 更新自动下载并缓存,用户即使在没有网络的环境下也能使用 AI 功能,尤其适合教育、医疗、工业巡检等弱网场景。
– **零延迟交互**:本地推理消除了网络往返时间,响应速度可达毫秒级,为实时性要求高的应用(如自动补全、实时翻译)提供了技术基础。

## 应用场景与生态影响

Prompt API 的开放将催生新一代“AI 原生网页”。例如:

– **智能写作助手**:在文本编辑器或邮件客户端中,用户可一键调用模型进行语法修正、风格改写或摘要生成,且数据不出浏览器。
– **个性化学习工具**:在线教育平台可利用本地模型实时解析学生提问,生成定制化习题或解释,同时保护学生隐私。
– **无障碍辅助**:视障用户可通过浏览器内置的 AI 语音指令实现页面导航与内容朗读,无需依赖外部云服务。

## 挑战与展望

尽管前景广阔,Prompt API 仍面临模型能力上限、设备兼容性以及开发者生态建设等挑战。Gemini Nano 目前仅支持文本生成与理解,多模态能力尚在规划中;同时,老旧设备可能因缺乏 GPU/NPU 加速而无法流畅运行。不过,随着 Chrome 团队持续优化模型压缩与硬件适配策略,以及 W3C 正在推进的 Web AI 标准化工作,浏览器原生 AI 有望在未来一年内成为 Web 开发的基础设施组件,彻底改变用户与网页的交互方式。

相关文章