文章摘要
ArchiveTeam Warrior是一款虚拟存档设备,用户可以在Windows、OS X和Linux系统上运行,帮助ArchiveTeam进行网站存档工作。它通过VirtualBox等虚拟机软件运行,仅占用带宽和部分磁盘空间,对电脑无风险。用户下载并启动虚拟机后,可通过浏览器访问本地界面,参与存档任务。
文章总结
Goo-gl 追踪器仪表板
运行 ArchiveTeam Warrior 进行数据归档
ArchiveTeam Warrior 是一款虚拟归档设备,用户可以通过运行它来协助 ArchiveTeam 的归档工作。该工具会自动下载网站内容并上传至归档库,操作非常简单。
Warrior 是一个虚拟机,因此对您的计算机没有任何风险。它只会占用您的带宽和部分磁盘空间。Warrior 支持在 Windows、OS X 和 Linux 系统上运行,您需要安装 VirtualBox(推荐)、VMware 或类似的虚拟机程序。
VirtualBox 使用步骤:
- 下载 Warrior 设备(357MB)。
- 在 VirtualBox 中,点击“文件”>“导入设备”,然后打开下载的文件。
- 启动虚拟机。它将自动获取最新更新,并最终提示您启动浏览器。
启动 Warrior 后:
- 访问 http://localhost:8001/ 并查看设置页面。
- 选择一个用户名,您的进度将显示在排行榜上。
- 转到“所有项目”选项卡,选择一个项目进行工作。更推荐选择“ArchiveTeam 的选择”,让 Warrior 自动处理最紧急的项目。
通过运行 Warrior,您可以轻松参与 ArchiveTeam 的归档工作,帮助保存重要的网络资源。
评论总结
评论内容总结:
对ArchiveTeam的赞扬
- 主要观点:ArchiveTeam在数据归档方面表现出色,高效且使命明确。
- 论据:dkh分享了个人经历,提到ArchiveTeam在短时间内高效地完成了视频归档任务,并充分利用了资源。
- 引用:
- "Within I want to say two minutes, the instances had been fully provisioned and were actively archiving videos as fast as was possible."
- "Basically they have always struck me as not only having a solid mission, but also being ultra-efficient in how they carry it out."
对数据规模的疑问
- 主要观点:Aardwolf对页面展示的数据集规模表示困惑,质疑91 TiB的数据是否仅包含短链接及其目标URL。
- 论据:Aardwolf认为短链接和目标URL的列表不可能达到91 TiB的规模。
- 引用:
- "The list of short links and their target URLs can't be 91 TiB in size can it?"
- "Does anyone know how this works?"
对社交媒体归档的关注
- 主要观点:SilverElfin询问是否有人在归档Reddit和Twitter的内容,即使这些平台的条款不允许。
- 论据:SilverElfin关注社交媒体内容的长期保存问题。
- 引用:
- "Is there anyone archiving all of reddit? Or twitter?"
- "I mean even if their terms have changed to not allow it."
对隐私和许可的担忧
- 主要观点:iJohnDoe质疑归档行为是否征得了相关方的同意,并提到可能涉及敏感信息。
- 论据:iJohnDoe提到GPT链接归档时曾公开敏感信息,担心类似问题再次发生。
- 引用:
- "Why? Did they ask anyone if it was okay?"
- "It's like when the GPT links were archived and publicly available that contained sensitive information."
对访问方式的疑问
- 主要观点:m3kw9询问如何访问这些归档数据,或者这是否是重点。
- 论据:m3kw9对归档数据的实际使用方式表示困惑。
- 引用:
- "Ok how do I access them, or is that not the point?"
对Google链接保存政策的解读
- 主要观点:raldi对Google关于保存最近点击链接的政策提出疑问,猜测是否所有链接现在都被视为“最近点击”。
- 论据:raldi试图理解Google政策的实际含义。
- 引用:
- "Google said they would keep hosting any recently-clicked link; does this mean that all the links are now recently-clicked?"
总结:评论中既有对ArchiveTeam高效归档的赞扬,也有对数据规模、隐私问题、访问方式和政策解读的疑问和担忧。不同观点反映了对数据归档行为的复杂态度。