Hacker News 中文摘要

RSS订阅

我自动化退订了500家数据经纪网站(开源) -- I automated opt-outs for 500 data broker sites (open source)

文章摘要

这是一个自动化工具,能每月从500多个个人信息网站和数据库自动提交删除请求,支持验证码破解、状态跟踪和完成通知,仅限macOS系统使用。

文章总结

以下是该GitHub项目的主要内容整理:

项目名称:自动身份信息移除工具(auto-identity-remove)

核心功能: - 每月自动从500+个人搜索网站和数据代理数据库中移除用户个人信息 - 支持CAPTCHA自动破解(通过CapSolver服务,约0.001美元/次) - 具备状态跟踪功能(90天内已处理的网站不会重复提交) - 任务完成后通过iMessage发送通知 - 需要人工处理的网站会自动在浏览器中打开

技术特性: 1. 工作流程: - 搜索各数据代理网站 - 定位用户特定信息 - 自动填写并提交退出表单 - 自动解决验证码 - 跳过近期已处理的网站 - 发送结果摘要 - 打开需要人工处理的网站

  1. 系统要求:
    • macOS系统(使用launchd进行任务调度)
    • Node.js 18+
    • Playwright浏览器环境

安装使用: 1. 克隆仓库并安装依赖 2. 运行交互式设置脚本(创建配置文件并设置每月任务) 3. 可随时手动运行

配置文件: - 包含个人信息、别名、CapSolver密钥等 - 所有敏感信息都保存在本地(gitignore保护)

特色功能: - 覆盖30+主流数据代理网站(如Spokeo、WhitePages等) - 通过通用处理器支持500+额外数据代理 - 特殊处理Google等需要人工操作的网站

与付费服务的对比: - 相比Incogni(96美元/年)等付费服务,本工具提供完全控制权 - 可补充付费服务未覆盖的网站(如Acxiom、LexisNexis等) - 建议与付费服务配合使用以获得最佳效果

项目结构: - 主要脚本:setup.js(设置)、watcher.js(主程序) - 配置文件:config.json(用户信息)、state.json(处理状态) - 数据代理列表:brokers.js

许可证:MIT开源协议

(注:已删除具体API密钥示例、详细文件目录结构等次要细节,保留核心功能和使用方法说明)

评论总结

以下是评论内容的总结:

主要观点与论据

  1. 工具功能与需求

    • 作者开发了自动化脚本帮助用户从500+数据代理网站退订,但存在局限性,需要更多帮助完善(评论1)。
      • "The heuristic approach misses a lot... Many of the generic sites have unique flows"
      • "Handle email verification flows (script submits the form but can’t click confirmation links in your inbox)"
    • 工具目前仅支持macOS,用户希望扩展到Linux/Windows(评论8, 10)。
      • "Supporting Systemd should be easy. Not sure what windows uses."
      • "Any chance of this not needing to run on a Mac?"
  2. 国际适用性问题

    • 多位用户询问工具是否适用于非美国地区(评论2, 4, 14)。
      • "Is this US only or would it also work for international profiles?"
      • "Does this work for anyone outside the US as well? e.g. Will it work for an Australian?"
    • 加拿大用户测试发现工具存在兼容性问题(评论14)。
      • "I suspect that having a non-numeric 'zip' code and a non-US address might be breaking a lot of the automation."
  3. 隐私与效果质疑

    • 部分用户担心工具可能反向泄露用户信息(评论3, 15)。
      • "I unironically suspect the purpose of many opt-out forms is merely to record the up-to-date information."
      • "I’m wondering if this isn’t a nice automated way to send your information to 500 data brokers."
    • 用户关注工具实际减少垃圾信息的效果(评论6)。
      • "Have you been using it a while and is it working to reduce spam?"
  4. 技术实现与改进建议

    • 用户建议增加审核模式防止信息误传(评论18)。
      • "I’d really want a dry-run/audit mode that shows which fields would be submitted to which broker before anything is sent."
    • 用户认可AI解决CAPTCHA的实用性(评论7, 12)。
      • "Right, so my suspicion was correct: I’m the only one being inconvenienced by the same old captchas."
      • "Now this is a good use of AI"
  5. 正面反馈

    • 用户称赞创意并期待开源解决方案(评论11, 13)。
      • "you ever look on a title and just immediately know that its going on the frontpage + staying there"
      • "Sweet, I’ve been wondering why it doesn’t exist as an open source solution."

总结

评论显示用户对该工具的兴趣集中在功能完善(多平台支持、国际适配)、隐私保护和实际效果验证上。虽然存在质疑,但多数人认可其潜在价值,并提出了具体改进建议。工具的适用性和可靠性是主要关注点。