快速实现LLM推理的两种不同技巧 -- Two different tricks for fast LLM inference
Anthropic和OpenAI近期都推出了"快速模式"以提升大模型推理速度。Anthropic的快速模式采用低批量推理,速度提升2.5倍但仍使用原版Opus 4.6模型;OpenAI则通过GPT-5.3-Codex-Spark实现15倍加速,但该简化模型性能有所下降。两者在速度与模型质量间做出了不同权衡。
前科技从业者——旧金山无家可归 -- Ex-Tech –> Homeless in SF
作者对比了两种截然不同的生活体验:一边是为富豪打造奢靡的超级碗活动,光鲜却虚伪;另一边是自己在旧金山街头流浪的艰辛回忆,身无分文、无处栖身。巨大的贫富差距和科技巨头冷漠的资本逻辑形成强烈反差,揭示了繁华都市背后的残酷现实。
亚马逊、谷歌无意间暴露美国监控国家的严重性 -- Amazon, Google Unwittingly Reveal the Severity of the U.S. Surveillance State
亚马逊和谷歌的智能家居设备无意中暴露了美国监控体系的严重性。近期事件显示,监控技术正快速渗透日常生活,引发隐私担忧。超级碗期间亚马逊Ring摄像头的广告刻意淡化监控问题,而谷歌Nest摄像头即使用户未订阅服务也能被公司访问,凸显监控的无处不在。
我修复了Windows原生开发 -- I Fixed Windows Native Development
文章吐槽了在Windows上使用Visual Studio作为项目构建依赖的糟糕体验,指出其安装过程复杂、版本选择混乱,开发者常被迫充当技术支持,而Linux工具链则简单得多。
闪存档案库——保存超过20万款网页游戏与动画 -- Flashpoint Archive – Over 200k web games and animations preserved
Flashpoint Archive是一个保存和提供Flash游戏及动画的在线档案库,支持多语言访问,包含新闻、常见问题、下载资源、源代码、品牌信息、联系方式等功能板块,并接受捐赠以支持项目运营。
x86-64 CPU有多少个寄存器?(2020) -- How many registers does an x86-64 CPU have? (2020)
x86-64 CPU的寄存器数量取决于定义方式,传统认为16个通用寄存器,但实际还包括浮点、向量、控制等寄存器,总数可达上千个。文章探讨了不同视角下的寄存器分类和计数方法。
燕麦(Oat)——超轻量、语义化、零依赖的HTML UI组件库 -- Oat – Ultra-lightweight, semantic, zero-dependency HTML UI component library
Oat是一款超轻量级、语义化的HTML UI组件库,无任何依赖,仅需引入8KB的CSS和JS文件即可使用。它直接为原生HTML元素和语义属性提供样式,无需类名,强制最佳实践并减少标记污染。支持无障碍访问和简单主题定制,适合快速构建美观的网页应用。
显示HN:离线网格——在手机上离线运行AI文本、图像生成与视觉功能 -- Show HN: Off Grid – Run AI text, image gen, vision offline on your phone
该项目是一款名为off-grid-mobile的离线AI工具,支持在移动设备上无需联网使用,提供聊天、语音和图像生成功能,所有数据处理均在本地完成,确保用户隐私安全。
我爱ArchWiki维护者的工作 -- I love the work of the ArchWiki maintainers
作者在"我爱自由软件日"特别感谢了自由软件文档维护者,尤其是ArchWiki的维护者们,认为他们为软件自由做出的贡献常被低估。文章附上了作者在FOSDEM 2025向Arch项目负责人和ArchWiki维护者赠送黑客巧克力的照片,表达了对这些默默付出的维护者的敬意。
NewPipe:无竖屏视频与算法推荐的YouTube客户端 -- NewPipe: YouTube client without vertical videos and algorithmic feed
NewPipe是一款免费的安卓端YouTube客户端应用,主打轻量、隐私友好和无广告体验。它提供快速、省电、低流量消耗的流媒体播放功能,支持离线使用,并且是开源项目。用户可通过GitHub获取代码,无需担心广告侵扰或可疑权限问题。