Hacker News 中文摘要

RSS订阅

Britannica11.org——1911年版《大英百科全书》结构化版本 -- Britannica11.org – a structured edition of the 1911 Encyclopædia Britannica

文章摘要

《大英百科全书》第11版(1910-1911年)共28卷,含36,663篇文章,内容可检索、互参照并附注释。

文章总结

《大英百科全书》第十一版(1910-1911年)

内容概要: 这部百科全书共28卷,收录了36,663篇条目,所有内容均可全文检索、相互参照并附有注释。作为20世纪初最具权威性的英语百科全书之一,第十一版以其学术性和系统性著称。

(注:原文中的图片链接、缓存提示等与技术性说明无关的内容已作删减处理,保留了版本核心信息和出版时间框架。)

评论总结

以下是评论内容的总结:

主要观点和论据

  1. 项目介绍与功能

    • 作者ahaspel将1911年版《大英百科全书》重建为一个结构清晰、易于导航的网站,包含3.7万篇文章、可点击的目录、交叉引用链接等。
      "~37k articles reconstructed from the original volumes"
      "The goal was to make something that feels like the original, but is actually usable."
  2. 技术细节与改进建议

    • 用户反馈了一些技术问题,如字体不支持特殊符号(robin_reala)、搜索功能不完善(Aardwolf)、导航问题(如“Zurich”搜索错误)。
      "the font you’ve chosen doesn’t support ℔"
      "Searching for Zurich allows you to go to the article for the canton of Zurich, not the city."
    • 用户realityfactchex建议增加原文与OCR文本的并排显示功能,以方便校对和欣赏原始排版。
      "I would love an option to see the text side by side with the page images."
  3. 历史价值与内容特点

    • 用户yodon和shantara指出1911年版的内容具有独特的历史视角和写作风格,部分条目包含现代已不常见的观点或情感表达。
      "The geography and key points of interest are described very accurately, but the authors aren’t shy about inserting emotionally charged adjectives."
      "The most important entry I found... is for Eavesdropping, detailing the original historical origins."
    • 用户neonscribe提到某些条目(如“Adolescence”)反映了当时的性别观念,现代读者可能会感到震惊。
      "Rest should be enforced during the menstrual periods... and milder, more graduated exercise taken at other times."
  4. 个人回忆与情感共鸣

    • 多位用户(如ahmedfromtunis、rustyhancock)分享了童年阅读百科全书或使用电子版(如Encarta)的怀旧记忆。
      "Reading some of the entries took me right back to being a kid huddled in my room for hours."
      "I still vividly remember the rush of installing Encarta for the first time on the family PC."
  5. 相关项目与技术讨论

    • 用户peterldowns和doctor_blood分享了类似项目的经验,讨论了OCR工具的选择(如paddleOCR)和数据结构的优化(如XML-TEI格式)。
      "I’ve been the most impressed with paddleOCR - it correctly split the text columns."
      "Would love to know more about how you OCR’d or otherwise ingested and parsed the raw material."
  6. 简洁赞扬

    • 部分用户(如keane、shevy-java)直接表达了对项目的赞赏,认为其优于现代AI生成的内容。
      "Beautiful work! This is an amazing resource to have online."
      "Already better than all AI wikipedias."

总结

评论普遍认可该项目的价值,认为其既保留了历史文献的原始风貌,又提升了可用性。用户反馈集中在技术改进(搜索、导航、OCR校对)、内容的历史独特性以及个人情感共鸣上。部分用户还提出了与其他历史文献数字化项目的关联建议。