Hacker News 中文摘要

RSS订阅

提示API -- The Prompt API

文章摘要

Chrome推出的Prompt API允许开发者通过自然语言与AI模型交互,目前处于实验阶段,支持Chrome 138和148版本,提供GitHub资源和Origin试用功能。

文章总结

Prompt API 技术文档精要

核心功能

Prompt API 允许开发者通过自然语言与浏览器内置的 Gemini Nano 模型交互,支持以下应用场景: - 智能搜索:基于网页内容回答问题 - 个性化新闻:动态分类文章并支持用户过滤 - 内容过滤:根据用户设定自动隐藏敏感内容 - 日历事件生成:从网页提取事件详情快速创建日程 - 联系人提取:自动抓取网站联系方式

系统要求

  • 操作系统:Windows 10+/macOS 13+/Linux/Chromebook Plus(ChromeOS 16389+)
  • 硬件
    • GPU需4GB以上显存 或 CPU需16GB内存+4核
    • 音频输入必须使用GPU
  • 存储:Chrome配置文件所在分区需22GB可用空间
  • 网络:需不限流量连接

开发要点

  1. 模型检测:通过LanguageModel.availability()检查模型状态,支持监听下载进度
  2. 会话管理
    • 使用create()创建会话,支持设置初始提示词和参数(topK/temperature)
    • 通过clone()复制会话,destroy()释放资源
  3. 多模态支持
    • 支持文本/图像/音频输入(HTMLImageElement/AudioBuffer等格式)
    • 需预先声明输入输出类型及语言(目前支持en/ja/es)
  4. 响应控制
    • 提供prompt()(即时响应)和promptStreaming()(流式响应)两种调用方式
    • 可通过JSON Schema约束输出格式

高级特性

  • 上下文管理:会话有token上限,溢出时会自动移除早期对话(系统提示词除外)
  • 本地开发:在localhost启用需设置Chrome实验性标志
  • 权限控制:默认仅限同源iframe,可通过allow="language-model"授权跨域访问

示例应用

官方提供多个演示项目,包括: - 音频转录(Mediarecorder Audio Prompt) - 图像描述生成(Canvas Image Prompt) - Chrome扩展程序示例(GitHub开源)

该API目前处于Origin Trial阶段,开发者需遵守Google的生成式AI使用政策。完整文档和问题反馈渠道详见Chrome开发者网站

评论总结

以下是评论内容的总结,平衡呈现不同观点并保留关键引用:

  1. 技术限制与用户体验问题

    • 磁盘空间要求高:"you must have at least 22 GB of free disk space" (fg137)
    • 模型下载体验差:"the model download is orders of magnitude greater than downloading the browser itself" (avaer)
  2. 隐私保护与本地化优势

    • 免费且保护隐私:"it's free and privacy preserving" (avaer)
    • 本地化AI的价值:"having a local-first AI...with tool-calling builtin" (gopalv)
  3. 潜在滥用风险

    • 可能被恶意脚本利用:"a rogue JS script to offload token generation" (jameslk)
    • 分布式计算的可能性:"decentralize the compute...using a subagent pattern" (jameslk)
  4. 模型能力限制

    • 功能有限:"useless for anything beyond 2 round chat" (nl)
    • 需要更强模型:"Qwen 0.9B is where things start working usefully" (nl)
  5. 创新应用场景

    • 社交内容净化:"a de-snarkifier for social media" (haberman)
    • 实用工具开发:"summarising our hack day write ups" (benjaminbenben)
  6. 标准化与未来展望

    • 需要跨平台标准:"OSes and browsers should provide an API to manage models" (rock_artist)
    • 小步前进:"it's a step into a future of proper Model API" (rock_artist)
  7. 其他观点

    • 设计考虑因素:API设计者的思考链接(domenicd)
    • 非主流社交平台:对Bluesky/Mastodon的关注(tethys)

关键趋势:评论普遍认可本地化AI的价值,但对其当前技术限制、潜在滥用风险和模型能力表示担忧,同时期待更完善的标准化解决方案。