Hacker News 中文摘要

RSS订阅

请翻译这个标题:Show HN: Nano PDF – 一个用Gemini的Nano Banana编辑PDF的CLI工具 -- Show HN: Nano PDF – A CLI Tool to Edit PDFs with Gemini's Nano Banana

文章摘要

Nano PDF是一个基于Google Gemini 3 Pro图像模型的CLI工具,可通过自然语言指令编辑PDF幻灯片,如"更新图表包含2025年数据"或"将图表改为柱状图"。该工具支持Python 3.10+,采用MIT开源许可。

文章总结

项目名称:Nano PDF 编辑器

项目简介:
Nano PDF 是一个基于 Google Gemini 3 Pro Image(代号 "Nano Banana")模型的 CLI 工具,支持通过自然语言指令编辑 PDF 幻灯片。项目采用 MIT 开源协议,需 Python 3.10+ 环境运行。


核心功能

  1. 自然语言编辑
    • 直接通过文字指令修改内容(如"将图表更新为2025年数据")。
  2. 新增幻灯片
    • 自动生成与现有文档风格匹配的新幻灯片。
  3. 非破坏性编辑
    • 通过 OCR 技术保留 PDF 可搜索文本层。
  4. 多页并行处理
    • 支持单命令批量编辑多页,可配置分辨率(4K/2K/1K)平衡质量与成本。

工作原理

  1. 页面渲染:使用 Poppler 将 PDF 转为图片
  2. 风格参考:可选指定参考页以继承视觉风格(字体/颜色/布局)
  3. AI 生成:Gemini 3 Pro 根据图片和指令生成新内容
  4. OCR 修复:通过 Tesseract 恢复可搜索文本
  5. PDF 重组:替换原页并保留文档结构

安装与配置

  • 安装命令pip install nano-pdf
  • 必要配置
    需付费的 Google Gemini API 密钥(申请地址),并设置环境变量:
    bash export GEMINI_API_KEY="your_api_key_here"

使用示例

基础操作

  • 单页编辑
    bash nano-pdf edit my_deck.pdf 2 "将标题改为'Q3业绩'"
  • 多页编辑
    bash nano-pdf edit my_deck.pdf 1 "更新日期至2025年10月" 5 "添加公司Logo"

高级功能

  • 新增幻灯片
    bash nano-pdf add my_deck.pdf 0 "生成标题页:'2025年Q3回顾'"
  • 风格控制
    通过 --style-refs 指定参考页,--resolution 调整生成质量。

系统依赖

| 操作系统 | 安装命令 | |----------------|-----------------------------------| | macOS | brew install poppler tesseract | | Windows | choco install poppler tesseract| | Linux(Ubuntu) | sudo apt-get install poppler-utils tesseract-ocr |


常见问题

  • API 报错:需确认已启用付费版 Gemini 服务
  • 风格不匹配:使用 --style-refs 明确参考页
  • OCR 异常:建议使用 4K 分辨率提升识别精度

开发版运行

bash git clone https://github.com/gavrielc/Nano-PDF.git cd Nano-PDF pip install -e .


项目地址GitHub - Nano-PDF
(注:本文已过滤安装路径配置等次要技术细节,聚焦核心功能与使用场景。)

评论总结

总结评论内容如下:

  1. 积极评价

    • 认为该方法创新实用:"This is nuts and I absolutely love this"(评论1)
    • 赞赏应用场景:"Updating a deck one-off is tedious...But now it can"(评论10)
  2. 功能改进建议

    • 需要更清晰的示例:"I'd love to see clearer examples"(评论2)
    • 建议添加演示动画:"consider adding an animated screengrab"(评论4)
  3. 潜在问题

    • 文件体积可能增大:"the file size will expand dramatically"(评论7)
    • 多次编辑可能影响质量:"would the image quality decrease?"(评论8)
  4. 扩展应用设想

    • 结合AI标注PDF:"could it use this to annotate the pdf like underlining them in red"(评论3)
    • 期待GUI版本:"it's now convenient to check the result after edit the PDF"(评论12)
  5. 技术疑问

    • 文本层保留问题:"any machine based extraction would still get the text"(评论5)
    • 对PDF生态的吐槽:"how many hacks there are to make PDFs semi-usable"(评论13)
  6. 使用体验反馈

    • 传统编辑工具对比:"nearly tore my hair out (thank you LibreOffice)"(评论6)
    • 对示例不足的顾虑:"The lack of examples makes me very reluctant"(评论14)

注:所有评论均未显示评分(None),总结时保持了正面(6条)、建议(4条)和质疑(4条)观点的平衡。