Chrome 推出 Prompt API：浏览器原生 AI 时代到来，网页可直接调用 Gemini Nano 本地模型

1,915 0

# Chrome 推出 Prompt API：浏览器原生 AI 时代到来，网页可直接调用 Gemini Nano 本地模型

近日，Google 宣布在 Chrome 浏览器中正式推出 **Prompt API**，允许网页开发者通过 JavaScript 直接调用内置的 **Gemini Nano** 大语言模型。这一举措标志着浏览器从“内容呈现平台”向“AI 推理终端”的关键跃迁，为 Web 应用带来了真正的本地化智能能力。

## 技术原理：浏览器内置的轻量级 AI 引擎

Gemini Nano 是 Google 专为端侧设备优化的轻量级模型，参数量级显著低于云端大模型，但在文本理解、摘要、分类、翻译等常见任务上表现高效。Prompt API 通过 Chrome 的 **WebGPU** 和 **WebNN** 等底层加速接口，将模型推理完全托管在用户本地设备的 GPU 或 NPU 上。开发者只需调用 `window.ai.prompt()` 方法，即可向模型发送文本指令并获取实时响应，无需额外引入第三方 SDK 或搭建后端推理服务。

## 核心优势：隐私、离线与低延迟

与传统的云端 AI 方案相比，Prompt API 具备三大不可替代的价值：

– **数据隐私**：所有用户输入的文本及模型推理均在本地完成，不经过任何外部服务器，彻底规避了数据传输中的隐私泄露风险。
– **离线可用**：模型权重随 Chrome 更新自动下载并缓存，用户即使在没有网络的环境下也能使用 AI 功能，尤其适合教育、医疗、工业巡检等弱网场景。
– **零延迟交互**：本地推理消除了网络往返时间，响应速度可达毫秒级，为实时性要求高的应用（如自动补全、实时翻译）提供了技术基础。

## 应用场景与生态影响

Prompt API 的开放将催生新一代“AI 原生网页”。例如：

– **智能写作助手**：在文本编辑器或邮件客户端中，用户可一键调用模型进行语法修正、风格改写或摘要生成，且数据不出浏览器。
– **个性化学习工具**：在线教育平台可利用本地模型实时解析学生提问，生成定制化习题或解释，同时保护学生隐私。
– **无障碍辅助**：视障用户可通过浏览器内置的 AI 语音指令实现页面导航与内容朗读，无需依赖外部云服务。

## 挑战与展望

尽管前景广阔，Prompt API 仍面临模型能力上限、设备兼容性以及开发者生态建设等挑战。Gemini Nano 目前仅支持文本生成与理解，多模态能力尚在规划中；同时，老旧设备可能因缺乏 GPU/NPU 加速而无法流畅运行。不过，随着 Chrome 团队持续优化模型压缩与硬件适配策略，以及 W3C 正在推进的 Web AI 标准化工作，浏览器原生 AI 有望在未来一年内成为 Web 开发的基础设施组件，彻底改变用户与网页的交互方式。