显示HN:Steerling-8B——能解释其生成任何标记的语言模型 -- Show HN: Steerling-8B, a language model that can explain any token it generates
Guide Labs团队发布了首个可解释性语言模型Steerling-8B,该模型能将生成的每个标记追溯到输入上下文、人类可理解的概念及训练数据。这个80亿参数的模型仅用1.35万亿标记训练,性能却接近使用2-7倍数据训练的模型。它支持推理时调控特定概念、追溯生成内容的训练数据来源,并通过概念控制实现安全对齐,无需大量安全训练样本。团队同时开源了模型权重和相关代码。
临床研究显示:血液检测将阿尔茨海默病诊断准确率提升至94.5% -- Blood test boosts Alzheimer's diagnosis accuracy to 94.5%, clinical study shows
一项临床研究表明,血液检测可将阿尔茨海默病的诊断准确率提升至94.5%,显著提高了该疾病的早期诊断能力。
我将Coreboot移植到ThinkPad X270 -- I Ported Coreboot to the ThinkPad X270
作者成功将开源固件Coreboot移植到Thinkpad X270笔记本上,过程中遇到硬件识别和NVMe启动问题,通过分析X270与X280的差异并寻求帮助最终解决。
将Wolfram技术作为LLM系统的底层工具 -- Making Wolfram Tech Available as a Foundation Tool for LLM Systems
文章指出,大型语言模型(LLM)虽然功能广泛但缺乏精确计算能力,需要补充基础工具。作者表示,自己40年来开发的Wolfram Language正是这样的工具,能够提供精确计算和知识,现在不仅人类可以使用,AI特别是LLM也可以利用这一技术。
如今写代码成本低廉 -- Writing code is cheap now
文章指出,随着AI技术的发展,编写代码的成本大幅降低,传统围绕代码高成本形成的开发习惯(如详细规划、功能评估)需要改变。开发者应适应这一新现实,调整工程实践以充分利用AI带来的效率提升。
陶哲轩,8岁(1984年)[pdf] -- Terence Tao, at 8 years old (1984) [pdf]
这篇文章讲述了数学家陶哲轩的成长经历。1975年出生的陶哲轩从小就展现出惊人的数学天赋,7岁时已开始学习高中课程。他通过观看《芝麻街》在2岁时就学会了读写,虽然学术能力相当于16岁青少年,但心理成熟度仍与同龄人相当。文章还探讨了其家庭环境对天赋发展的影响及相关的教育启示。
UNIX99,一款为TI-99/4A打造的类UNIX操作系统(2025) -- UNIX99, a UNIX-like OS for the TI-99/4A (2025)
文章介绍了UNIX99,这是一款为TI-99/4A计算机开发的类UNIX操作系统,相关讨论发布在AtariAge论坛的TI-99/4A开发版块中。
Ubuntu采用Rust的意义 -- What it means that Ubuntu is using Rust
作者参加Rust Nation大会后,思考Rust语言是否已跨越"鸿沟"被主流采用。以Ubuntu采用Rust为例,指出在亚马逊等企业内,Rust已成为构建大规模数据平面和资源敏感代理的首选,在设备及机器人底层代码中也日益普及,但仍有部分人认为其不适合所有场景。Rust的采用程度因领域而异。
沙特纳与35位金属乐偶像合作制作专辑 -- Shatner is making an album with 35 metal icons
威廉·夏特纳以《星际迷航》中柯克船长一角闻名,现宣布将推出一张全明星金属专辑。他坦言金属乐是释放想象力的领域,新专辑将集结众多金属吉他手,呈现震撼的吉他演奏、电影化编曲,以及黑暗幽默和原始情感。尽管他持吉他姿势非正统,甚至可能使用AI生成的吉他,但他强调这不是一张"猎奇专辑",而是充满诚意的音乐探索,灵感来自与前Megadeth吉他手的合作。
53款车型“洗车”测试 -- “Car Wash” test with 53 models
文章测试了53个主流AI模型在"洗车测试"中的表现,发现大多数模型无法像人类一样正确回答"50米外的洗车场应该开车去"这个简单逻辑问题,包括Claude、GPT-5.1等顶级模型也未能通过。该测试揭示了当前AI在基础推理能力上的明显缺陷。