HorizonDB:用Rust编写的地理编码引擎,替代Elasticsearch -- HorizonDB, a geocoding engine in Rust that replaces Elasticsearch

Radar公司为提升性能,开发了基于Rust和RocksDB的HorizonDB地理空间数据库,替代了原有的Elasticsearch和MongoDB。HorizonDB整合了多种定位服务,显著提升了处理能力,支持每天处理超过10亿次API调用,并在普通硬件上实现线性扩展,优化了地理编码等服务的响应时间。

AI令人印象深刻,只因我们在个人计算领域表现不佳 -- AI is impressive because we've failed at personal computing

AI之所以令人印象深刻,部分原因在于我们在语义网和个人计算领域的失败。现代大型语言模型(LLM)能够从互联网的混乱中提取答案,而传统搜索引擎和文件管理系统则难以有效组织和检索信息。例如,ChatGPT能迅速回答复杂问题,而Google的AI工具却表现不佳。这种成功反映了我们在信息组织方面的不足,促使AI通过搜索捷径来弥补这一缺陷。

注意力汇聚机制如何确保语言模型稳定 -- How Attention Sinks Keep Language Models Stable

研究发现,语言模型在处理长对话时崩溃的原因是旧词被移除后,模型会将大量注意力集中在最初的几个词上,称为“注意力汇”。为解决这一问题,StreamingLLM方法永久保留前四个词,同时滑动处理其他内容,使模型能稳定处理超过400万个词。这一机制已被应用于HuggingFace、NVIDIA TensorRT-LLM和OpenAI的最新模型中。OpenAI在其开源大模型中引入了类似的注意力汇机制,通过为每个注意力头的softmax计算添加可训练标量值,使模型在需要时“不关注任何词”。

食品、住房和医疗成本成为多数人的主要压力源 -- Food, housing, & health care costs are a source of major stress for many people

食品、住房和医疗费用是许多人主要的压力来源,这些高昂的生活成本给人们带来了巨大的经济负担和心理压力。

超薄名片实现流体模拟 -- Ultrathin business card runs a fluid simulation

该仓库包含与flip-card项目相关的所有文件,该项目是一个运行流体隐式粒子(FLIP)模拟的名片。PCB设计文件位于“kicad-pcb”文件夹中,流体模拟逻辑则独立存放在“fluidsimcrate”文件夹中,基于Matthias Müller的研究。项目还包含可充电电池设计和WASM模拟器,用于调试模拟问题,具体实现细节可在各文件夹的README文件中找到。

美国将重写其以往国家气候报告 -- US to rewrite its past national climate reports

美国计划重新修订其过去的国家气候报告,以更新和调整相关数据和政策,以应对当前的气候变化挑战。

线性让我陷入本地优先的深坑 -- Linear sent me down a local-first rabbit hole

作者在使用Linear项目管理工具时,对其即时响应和无网络延迟的特性感到惊讶,进而深入研究了其技术实现。通过逆向工程和同步协议的解析,作者发现Linear采用了本地优先(local-first)的设计理念,这种设计使得应用在离线状态下仍能高效运行,彻底改变了作者对传统网页应用的认知。

实现高保真标签下训练数据万倍缩减 -- Achieving 10,000x training data reduction with high-fidelity labels

谷歌研究团队开发了一种新的可扩展的主动学习流程,能够大幅减少大语言模型微调所需的训练数据量,同时显著提高模型与人类专家的一致性。该流程适用于包含数百亿样本的数据集,通过迭代识别关键样本,有效应对复杂任务如识别违规广告内容,并降低因政策变化或新类型违规内容出现而导致的模型重新训练成本。

新行政令将全部拨款置于政治管控之下 -- New executive order puts all grants under political control

特朗普政府发布行政命令,将联邦资助的研究项目置于政治控制之下,要求所有资助机会的公告需由机构负责人或其指定人员审查,确保资助项目符合总统政策优先事项,并赋予机构随时取消已授予资助的权力。

GPT-5系统提示泄露 -- GPT-5 leaked system prompt

GPT-5模型具备图像输入功能,知识截止至2024年6月,当前日期为2025年8月8日。其人格设置为v2,强调清晰、耐心、幽默的互动风格,避免使用版权材料,并鼓励用户自信与好奇心。模型在解释复杂话题时灵活调整,避免使用犹豫性结束语,直接执行明确步骤。ChatGPT Plus或Pro计划提供深度研究和视频生成功能,若用户询问GPT-4.5等模型,需告知相关信息。