BarraCUDA:面向AMD GPU的开源CUDA编译器 -- BarraCUDA Open-source CUDA compiler targeting AMD GPUs
BarraCUDA是一个开源CUDA编译器,能将CUDA代码直接编译为AMD GPU可执行的GFX11机器码,无需依赖LLVM或HIP转换层。该项目用1.5万行C99代码实现,包含手写的指令选择器,可直接生成ELF格式的.hsaco二进制文件,目前支持AMD RDNA3架构。
感谢HN:您帮助拯救了3.3万条生命 -- Thank HN: You helped save 33k lives
作者感谢Hacker News社区13年前对Watsi.org的支持,这个医疗众筹平台至今已帮助拯救了3.3万人的生命。
Discord竞争对手因玩家逃离年龄验证而陷入用户流失困境 -- Discord Rival Gets Overwhelmed by Exodus of Players Fleeing Age-Verification
由于Discord加强年龄验证措施,大量玩家转向竞争对手TeamSpeak,导致其服务器不堪重负。TeamSpeak似乎对这次技术故障表现得相当乐观。
展示HN:AsteroidOS 2.0——虽无人问津,我们依然发布 -- Show HN: AsteroidOS 2.0 – Nobody asked, we shipped anyway
AsteroidOS 2.0正式发布,带来多项重要更新:新增常亮显示功能,支持更多智能手表型号,优化用户界面性能,改进启动器样式和快捷设置自定义,并增强了同步客户端功能。这是社区共同努力的成果,标志着系统在设计和用户体验上的显著提升。
斯蒂芬·科尔伯特称CBS因FCC威胁禁止采访民主党人 -- Stephen Colbert says CBS forbid interview of Democrat because of FCC threat
斯蒂芬·科拜尔在节目中透露,CBS因担心联邦通信委员会(FCC)执行"平等时间规则"而阻止他采访民主党参议员候选人。科拜尔表示,公司律师明确禁止他邀请该候选人上节目,甚至禁止他提及此事,但他在节目中仍对此进行了讨论。
特斯拉"Robotaxi"在奥斯汀一个月内再添5起事故——事故率是人类的4倍 -- Tesla 'Robotaxi' adds 5 more crashes in Austin in a month – 4x worse than humans
特斯拉在得州奥斯汀的Robotaxi车队新增5起事故,总数达14起,其中一起事故升级为致伤住院但未公开。最新5起事故涉及Model Y自动驾驶模式,包括与固定物、公交车及卡车相撞等,但特斯拉仍以商业机密为由隐瞒事故详情,成为唯一系统性隐瞒事故细节的自动驾驶运营商。
美国现任总统推出两种迷因币致超43亿美元蒸发 -- A sitting US president launched two memecoins that wiped out $4.3B+
美国现任总统发行的两种迷因币导致散户损失超43亿美元,内部人士却套现6亿多美元。其中$TRUMP币暴跌95%,$MELANIA币暴跌99%。推文讽刺称其为"加密货币总统"。
国际象棋引擎的诡异行为 -- Chess engines do weird stuff
文章指出,国际象棋引擎通过强化学习训练后,发现搜索算法比模型质量更重要。即使使用较差模型配合搜索,也能产生优秀结果,因此可以通过蒸馏技术从已有强模型中学习,无需重复昂贵的自我对弈训练。这种蒸馏方法效果远超传统RL中的最佳选择策略,因为象棋搜索能大幅提升模型表现,相当于模型规模扩大30倍的效果。
所以你想建一条隧道 -- So you want to build a tunnel
文章介绍了当前网络上流行的个人隧道建造热潮,列举了多位博主如Colin Furze、"隧道女孩"Kala等通过视频分享自己挖掘地下隧道或空间的经历,展现了这一DIY工程现象。
GPU上的异步/等待 -- Async/Await on the GPU
VectorWare公司宣布成功在GPU上实现Rust的async/await功能,这是GPU编程的重大突破。该技术让开发者能使用熟悉的Rust抽象语法编写高性能GPU应用,突破了传统GPU仅支持数据并行的限制,为复杂GPU程序开发开辟了新途径。