展示 HN:Terminal-Bench-RL:用强化学习训练长视野终端代理 -- Show HN: Terminal-Bench-RL: Training Long-Horizon Terminal Agents with RL
该项目成功构建了可扩展至32个H100 GPU的强化学习训练基础设施,用于训练长时程终端编码代理。开发者开发了Terminal-Agent-Qwen3-32b,使其成为Stanford TerminalBench排行榜上得分最高的Qwen3代理,且无需训练。该项目基于UC Berkeley Sky Lab的rLLM框架,扩展了自定义环境和基础设施,专门用于终端代理训练。
学习模式 -- Study Mode
OpenAI推出了“学习模式”,旨在帮助用户更高效地利用ChatGPT进行学习和研究。该模式通过优化对话流程和提供针对性建议,提升用户的学习体验和知识获取效率。
可观察笔记本 2.0 技术预览 -- Observable Notebooks 2.0 Technology Preview
Observable Notebooks 2.0技术预览版发布,包含Observable Notebook Kit和Observable Desktop两大工具,支持本地文件编辑和AI功能,采用本地优先策略,未来将实现无缝协作与分享。目标是支持文件工作流、简化JavaScript使用、现代化笔记本功能,并优化静态站点渲染体验。
60秒内完成Linux性能分析(2015) -- Linux Performance Analysis in 60 seconds (2015)
Netflix技术团队分享了在Linux服务器上快速诊断性能问题的60秒优化流程。通过使用标准Linux性能工具,如top、vmstat、iostat等,团队能够在短时间内获取关键性能指标,如CPU、内存、磁盘I/O和网络状态,从而快速定位问题根源。这一方法结合了Netflix自有的监控工具Atlas和Vector,帮助高效解决大规模EC2云环境中的性能问题。
我的2.5年老笔记本现在能用JavaScript写《太空入侵者》了(GLM-4.5 Air) -- My 2.5 year old laptop can write Space Invaders in JavaScript now (GLM-4.5 Air)
作者使用中国Z.ai公司发布的GLM-4.5 Air模型,在2.5年前的64GB MacBook Pro M2笔记本电脑上成功运行了3bit量化版本,并生成了可直接运行的《太空入侵者》游戏代码,展示了该模型在编码任务中的高效表现。
年龄验证法推动VPN使用激增,威胁开放互联网 -- Age Verification Laws Send VPN Use Soaring–and Threaten the Open Internet
年龄验证法律的实施导致VPN使用量激增,这可能威胁到互联网的开放性。这些法律要求用户验证年龄以访问某些内容,促使更多人使用VPN绕过限制,但也引发了对互联网自由和隐私的担忧。
无片可看——实验性画廊展示五万张电影海报 -- Nothing to watch – Experimental gallery visualizing 50k film posters
这篇文章表达了一种观点,即当前没有值得观看的内容。通过简洁的标题和重复的强调,作者传达了对现有媒体内容的失望或无聊感,暗示观众可能难以找到吸引人的节目或作品。
无用的useCallback -- The Useless UseCallback
文章探讨了在React中使用useCallback和useMemo进行性能优化的必要性,指出在许多情况下这些钩子并无实际作用,反而可能增加代码复杂性。作者强调,只有在确实需要减少不必要的重新渲染或计算时,才应使用这些钩子,否则应避免滥用。
维基媒体基金会挑战英国《在线安全法》条例 -- Wikimedia Foundation Challenges UK Online Safety Act Regulations
维基媒体基金会将于2025年7月22日至23日在伦敦高等法院对英国《在线安全法》的分类规定提出法律挑战。基金会认为这些规定威胁到维基百科及其全球志愿者社区,强调维基百科是互联网知识的重要支柱,呼吁法院在此案中为保护在线公共利益项目树立全球先例。
停止兜售“无限”,当你实际意思是“直到我们改变主意” -- Stop selling “unlimited”, when you mean “until we change our minds”
文章批评了企业使用“无限”作为营销手段,但实际上却在未来可能改变政策或限制服务。作者呼吁企业应诚实透明地传达产品和服务,避免误导消费者。