Kimi K2.6在编程挑战中击败Claude、GPT-5.5和Gemini -- Kimi K2.6 just beat Claude, GPT-5.5, and Gemini in a coding challenge
中国初创公司Moonshot AI的开源模型Kimi K2.6在编程挑战赛中击败了Claude、GPT-5.5和Gemini等西方主流模型,以22分和7胜1平0负的成绩夺冠,小米的MiMo V2-Pro获得亚军。这项比赛通过实时编程任务对各大语言模型进行客观评分。
开源不等于开放社区 -- Open source does not imply open community
开源软件不等于开放社区。早期开源仅通过网页、邮件列表等简单方式分享代码,没有现代协作平台的管理负担。GitHub等工具虽便利,却将开源维护变成无薪工作,带来议题跟踪、社区管理等额外压力,偏离了纯粹分享代码的初衷。
马里兰州率先禁止杂货店使用人工智能哄抬物价 -- Maryland Is First to Ban A.I.-Driven Price Increases in Grocery Stores
马里兰州成为美国首个禁止超市和外卖平台利用消费者个人数据及人工智能进行动态定价的州,该法律将于10月生效,旨在防止针对不同消费者的差别化涨价行为。
秘密网络走私星链技术入伊朗以突破网络封锁 -- Clandestine network smuggling Starlink tech into Iran to beat internet blackout
伊朗民众通过秘密网络走私星链设备入境,以突破政府实施的网络封锁。活动人士萨汉德表示,即使多一人能上网也值得,但担心自己和国内亲友的安全。伊朗已持续两个多月的断网始于美以空袭后,是史上最长的全国性断网之一。
《数百万行Haskell代码:Mercury的生产工程实践》 -- A Couple Million Lines of Haskell: Production Engineering at Mercury
文章介绍了Haskel编程语言在生产环境中的实际应用案例,重点讲述了Mercury公司如何成功使用数百万行Haskell代码进行工程实践,展现了该语言在工程严谨性和创造性方面的独特优势。
语言模型中的拒绝行为由单一方向调控 -- Refusal in Language Models Is Mediated by a Single Direction
该研究发现语言模型的拒绝行为由单一方向调控,揭示了模型拒绝回答的机制原理。
被迫行动 -- Zugzwang
国际象棋术语"Zugzwang"指一方被迫走棋导致局面恶化的困境,源于德语"被迫移动"。这种局面下任何走法都会削弱自身,常见于残局,也用于描述其他领域类似处境。
29年后,一款未知的世嘉土星项目浮出水面 -- An unknown Sega Saturn project has come to light after 29 years
文章介绍了一款未被世嘉土星平台发布的游戏《Pyramid》原型光盘。这款游戏可能是未发行的FMV游戏《金字塔之谜:安卡2》的版本。经过29年保存完好的光盘仍能正常运行,展示了游戏启动画面。该游戏未被收录在世嘉复古网站的未发布游戏列表中,具有独特的研究价值。
特斯拉车主因全自动驾驶虚假宣传获赔1万美元,特斯拉仍在继续上诉 -- Tesla owner won $10k in court for Tesla's FSD lies. Tesla is still fighting him
特斯拉长期承诺提供全自动驾驶功能,但多年未兑现,部分车主要求退款。车主本·高维瑟因特斯拉未履行承诺赢得1.06万美元赔偿,但特斯拉仍在拖延支付。高维瑟2021年花费1万美元购买全自动驾驶软件,但五年后车辆仍无法实现完全自动驾驶,特斯拉至今未向任何车主提供L5级自动驾驶功能。
尼安德特人在12.5万年前运营"脂肪工厂"(2025年) -- Neanderthals ran 'fat factories' 125,000 years ago (2025)
研究发现尼安德特人在12.5万年前就掌握了从动物骨骼中提取油脂的复杂技术。他们在德国一处遗址将大型动物骨骼粉碎后加热熬油,这种高热量食物加工技术比此前认知提前了数万年,展现了早期人类应对资源稀缺的智慧。