文章摘要
文章讲述了作者尝试通过公开的网络爬虫存档(如Common Crawl)恢复已故美食家Anthony Bourdain丢失的Li.st列表。作者利用自己的网络安全和爬虫经验,编写了一个Python脚本从公共数据集中检索相关HTML文档,并成功找到了一些内容。
文章总结
追寻安东尼·波登遗失的清单
文章来源:https://sandyuraz.com/blogs/bourdain/
发布时间:2025年12月14日
缘起
两日前,笔者偶然读到《GReg TeChnoLogY》整理的安东尼·波登遗失清单,萌生了通过公开网络存档恢复部分内容的想法。虽无权限访问专有存储库,但凭借网络安全与爬虫领域的经验,决定尝试从公共爬虫档案中寻找线索。
探索过程
公共爬虫档案(Common Crawl)
- 参照文档说明,编写了
commoncrawl_search.py脚本,通过检索特定数据集前缀索引定位潜在内容。 - 成功恢复部分HTML文档(注:图片已永久丢失)。
- 严格保留波登原文的语法风格,仅调整排版以还原
li.st平台原始样式。
- 参照文档说明,编写了
恢复清单精选
- 不再容忍之事:可卡因、啤酒极客、服务员解说比用餐时间更长的晚餐等。
- 难忘风景:蒙大拿日落、波多黎各海滩、伊斯坦布尔烤羊肉佐美景。
- 荒岛影视清单:《火线》《锅匠,裁缝,士兵,间谍》等冷门佳作。
- 执念之物:19世纪颅骨钻孔器、越南蒙塔格纳德手镯、手工锻造克雷默厨刀。
- 间谍小说推荐:萨默塞特·毛姆《英国间谍阿兴登》等5部由真实间谍撰写的作品。
未竟之憾
- 仅一页内容未能从公共爬虫恢复。
- 图片因早期云端存储关闭而永久缺失,成为最大遗憾。
项目意义
此次数字考古不仅重现了波登的生活碎片,更启示我们建立公共档案的必要性。作者已将项目开源至GitHub仓库,邀请同道者共同守护文化记忆。
结语:这场与时间赛跑的抢救,虽不完美,却为逝去的时代留下了珍贵的文字注脚。
(注:文中所有粗体、标点缺失等特殊格式均忠实还原波登原始文本风格。)
评论总结
这篇评论主要围绕已故厨师Anthony Bourdain的存档内容恢复展开,主要观点如下:
- 对内容恢复的赞赏
- "Very happy to see these recovered and archived :)!"(很高兴看到这些内容被恢复和存档!)
- "Kudos to those who performed recovery and snatched back from the sands of time."(向那些进行恢复工作的人致敬)
- 对图像存档的期待
- "I hope images are able to be recovered"(希望能恢复图像)
- "wonder what avenues still exist for the image archives"(想知道图像存档还有什么途径)
- 网站设计批评
- "using light grey font on a white background is not only ugly, it is basically illegible"(白底灰字不仅难看,而且基本看不清)
- 对Bourdain的疑问
- "for the uninitiated among us, what's interesting about these or the person?"(对我们这些不了解的人来说,这些内容或这个人有什么有趣的?)
- 对具体内容的讨论
- "Great Dead Bars of New York"(纽约已消失的伟大酒吧)
- "Any movie list that features Tampopo is good by me"(任何包含《蒲公英》的电影清单我都喜欢)
- 对Bourdain品味的认可
- "Obviously he has better food taste than I do"(显然他的美食品味比我好)
- 关于他买不起高价刀具的质疑:"I highly doubt he couldn't afford a $2,500 knife"(我很难相信他买不起2500美元的刀)