Hacker News 中文摘要

RSS订阅

ArchiveTeam已完成所有goo.gl短链接存档 -- ArchiveTeam has finished archiving all goo.gl short links

文章摘要

ArchiveTeam Warrior是一款虚拟存档设备,用户可以在Windows、OS X和Linux系统上运行,帮助ArchiveTeam进行网站存档工作。它通过VirtualBox等虚拟机软件运行,仅占用带宽和部分磁盘空间,对电脑无风险。用户下载并启动虚拟机后,可通过浏览器访问本地界面,参与存档任务。

文章总结

Goo-gl 追踪器仪表板

运行 ArchiveTeam Warrior 进行数据归档

ArchiveTeam Warrior 是一款虚拟归档设备,用户可以通过运行它来协助 ArchiveTeam 的归档工作。该工具会自动下载网站内容并上传至归档库,操作非常简单。

Warrior 是一个虚拟机,因此对您的计算机没有任何风险。它只会占用您的带宽和部分磁盘空间。Warrior 支持在 Windows、OS X 和 Linux 系统上运行,您需要安装 VirtualBox(推荐)、VMware 或类似的虚拟机程序。

VirtualBox 使用步骤:

  1. 下载 Warrior 设备(357MB)。
  2. 在 VirtualBox 中,点击“文件”>“导入设备”,然后打开下载的文件。
  3. 启动虚拟机。它将自动获取最新更新,并最终提示您启动浏览器。

启动 Warrior 后:

  1. 访问 http://localhost:8001/ 并查看设置页面。
  2. 选择一个用户名,您的进度将显示在排行榜上。
  3. 转到“所有项目”选项卡,选择一个项目进行工作。更推荐选择“ArchiveTeam 的选择”,让 Warrior 自动处理最紧急的项目。

通过运行 Warrior,您可以轻松参与 ArchiveTeam 的归档工作,帮助保存重要的网络资源。

评论总结

评论内容总结:

  1. 对ArchiveTeam的赞扬

    • 主要观点:ArchiveTeam在数据归档方面表现出色,高效且使命明确。
    • 论据:dkh分享了个人经历,提到ArchiveTeam在短时间内高效地完成了视频归档任务,并充分利用了资源。
    • 引用:
      • "Within I want to say two minutes, the instances had been fully provisioned and were actively archiving videos as fast as was possible."
      • "Basically they have always struck me as not only having a solid mission, but also being ultra-efficient in how they carry it out."
  2. 对数据规模的疑问

    • 主要观点:Aardwolf对页面展示的数据集规模表示困惑,质疑91 TiB的数据是否仅包含短链接及其目标URL。
    • 论据:Aardwolf认为短链接和目标URL的列表不可能达到91 TiB的规模。
    • 引用:
      • "The list of short links and their target URLs can't be 91 TiB in size can it?"
      • "Does anyone know how this works?"
  3. 对社交媒体归档的关注

    • 主要观点:SilverElfin询问是否有人在归档Reddit和Twitter的内容,即使这些平台的条款不允许。
    • 论据:SilverElfin关注社交媒体内容的长期保存问题。
    • 引用:
      • "Is there anyone archiving all of reddit? Or twitter?"
      • "I mean even if their terms have changed to not allow it."
  4. 对隐私和许可的担忧

    • 主要观点:iJohnDoe质疑归档行为是否征得了相关方的同意,并提到可能涉及敏感信息。
    • 论据:iJohnDoe提到GPT链接归档时曾公开敏感信息,担心类似问题再次发生。
    • 引用:
      • "Why? Did they ask anyone if it was okay?"
      • "It's like when the GPT links were archived and publicly available that contained sensitive information."
  5. 对访问方式的疑问

    • 主要观点:m3kw9询问如何访问这些归档数据,或者这是否是重点。
    • 论据:m3kw9对归档数据的实际使用方式表示困惑。
    • 引用:
      • "Ok how do I access them, or is that not the point?"
  6. 对Google链接保存政策的解读

    • 主要观点:raldi对Google关于保存最近点击链接的政策提出疑问,猜测是否所有链接现在都被视为“最近点击”。
    • 论据:raldi试图理解Google政策的实际含义。
    • 引用:
      • "Google said they would keep hosting any recently-clicked link; does this mean that all the links are now recently-clicked?"

总结:评论中既有对ArchiveTeam高效归档的赞扬,也有对数据规模、隐私问题、访问方式和政策解读的疑问和担忧。不同观点反映了对数据归档行为的复杂态度。