Hacker News 中文摘要

RSS订阅

显示HN:Ghost Pepper——macOS本地按住说话语音转文字工具 -- Show HN: Ghost Pepper – Local hold-to-talk speech-to-text for macOS

文章摘要

Ghost-pepper是一款macOS本地语音转文字工具,通过按住Control键录音,松开后自动转录并粘贴文本。它完全在本地运行,基于WhisperKit技术,并使用本地LLM进行文本清理优化。

文章总结

Ghost Pepper:macOS本地语音转文字工具

项目简介
Ghost Pepper是一款专为macOS设计的纯本地语音转文字工具,用户按住Control键说话,松开后即可自动转录并粘贴文本。所有处理均在设备本地完成,无需依赖云端API,确保数据隐私安全。

核心功能
- 即按即说:通过Control键控制录音,释放后自动转录并粘贴。
- 完全本地化:基于WhisperKit和本地LLM模型处理,数据不离设备。
- 智能优化:本地大语言模型可删除冗余词(如"嗯"、"啊")并修正口语化表达。
- 轻量后台:仅驻留菜单栏,无Dock图标,支持开机自启。
- 高度可定制:可调整清理提示词、选择麦克风或开关功能模块。

技术架构
1. 语音模型
- 默认使用Whisper small.en(466MB,英语专用,精度最佳)
- 支持多语言模型(如Parakeet v3,1.4GB)
2. 文本优化模型
- 默认Qwen 3.5 0.8B(535MB,响应速度1-2秒)
- 可选更高精度模型(如4B版本,处理需5-7秒)
技术依赖:WhisperKit(语音)、LLM.swift(文本优化)、Hugging Face(模型托管)

使用指南
1. 下载最新DMG安装包
2. 授予麦克风与辅助功能权限
3. 按住Control键开始录音

企业部署
对于受管理的设备,IT管理员可通过MDM配置预授权:
- Bundle ID: com.github.matthartman.ghostpepper
- 权限类型: 辅助功能(com.apple.security.accessibility

项目优势
- 隐私保护:所有处理均在本地完成
- 开源免费:MIT许可,对比同类商业化产品(如已融资8000万美元的竞品)
- 轻量化:基础模型仅需75MB存储空间

系统要求
- macOS 14.0+
- Apple Silicon芯片(M1及以上)

数据统计:截至2026年4月,项目获345星标,19个分叉,4位主要贡献者。

(注:原文中GitHub导航菜单、企业解决方案等无关内容已精简,保留核心功能说明和技术细节)

评论总结

以下是评论内容的总结:

  1. 与其他类似工具的比较

    • 用户询问与Hex、Handy、faster-whisper等工具的比较。
    • 引用:"what are your thoughts on how they compare?" (评论1)
    • 引用:"Do you know how it compares to Handy?" (评论4)
  2. 性能与准确性

    • Parakeet被认为比Whisper更快、更准确,但需语言支持。
    • 引用:"Parakeet is significantly more accurate and faster than Whisper" (评论2)
    • 引用:"I've been using parakeet v3 which is fantastic (and tiny)" (评论9)
  3. 本地化与隐私

    • 用户赞赏本地化速度和隐私保护,但也有对macOS内置功能的质疑。
    • 引用:"I appreciate the emphasis on local speed and privacy" (评论1)
    • 引用:"how does this compare to macos built in siri TTS, in quality and in privacy?" (评论10)
  4. 功能需求与改进建议

    • 用户希望支持视频转录、实时输入、多平台支持等。
    • 引用:"let me play a speech video and transcribe it for me" (评论6)
    • 引用:"when windows? why can you just make things multios" (评论16)
  5. 技术实现与模型选择

    • 讨论是否需大型模型,以及Whisper的更新情况。
    • 引用:"Larger local models generally shouldn't require a subordinate model for clean up" (评论3)
    • 引用:"Are these the same old OpenAI whispers or have they been updated heavily?" (评论9)
  6. 个性化与定制化

    • 用户希望模型能根据个人语音和术语定制。
    • 引用:"the killer feature to me will be one that fine tunes the model based on your own voice" (评论12)
  7. 使用体验与问题反馈

    • 部分用户遇到麦克风权限问题,也有用户分享高效使用技巧。
    • 引用:"There is no popup asking for microphone permission" (评论8)
    • 引用:"I've been doing a lot of 'coding' by tapping a button on my Stream Deck" (评论13)
  8. 资源与工具推荐

    • 用户分享其他工具和资源,如hyprwhspr、yap等。
    • 引用:"For Linux folks, I developed hyprwhspr" (评论3)
    • 引用:"you can also use yap dictate" (评论5)

总结:评论主要围绕工具比较、性能、隐私、功能需求和技术实现展开,同时包含使用体验反馈和资源推荐。