GPT-5o-mini误报医学生实习申请成绩 -- GPT-5o-mini hallucinates medical residency applicant grades
文章介绍了Thalamus平台提供的Cortex核心实习成绩和成绩单标准化功能,旨在帮助医学院管理实习生的评分和成绩单处理,优化实习管理流程。
天文学家"拍摄"到遥远宇宙中的神秘暗天体 -- Astronomers 'image' a mysterious dark object in the distant Universe
天文学家在遥远宇宙中发现了一个神秘的黑暗天体,这一发现可能为研究宇宙演化提供新线索。
数组语言动物园 -- Zoo of Array Languages
ktye的个人主页展示了多个编程语言项目,主要包括K语言实现、APL方言合集及其他数组语言工具,提供相关文档、源码和在线运行链接。
Pyrefly:基于 Rust 的 Python 类型检查器与语言服务器 -- Pyrefly: Python type checker and language server in Rust
Pyrefly是一款快速的Python类型检查器和语言服务器,能以每秒185万行代码的速度进行类型检查,并提供闪电般的自动补全和即时错误反馈。它在性能测试中与Pyright、MyPy等工具表现相当,支持多线程优化,适用于大型代码库开发。开发者可通过Discord获取支持。
ADS-B暴露 -- ADS-B Exposed
ADS-B Massive Visualizer是一个基于ClickHouse开源数据库开发的航空数据可视化平台,可展示飞机、鸟类等多种目标的飞行数据,包括高度、速度、机型等信息,并提供地图可视化功能。
黑客可窃取安卓手机双重验证码及私密信息 -- Hackers can steal 2FA codes and private messages from Android phones
研究人员发现名为"Pixnapping"的新型安卓攻击方式,恶意应用无需权限即可窃取屏幕显示的二次验证码等敏感信息,谷歌虽发布修复补丁但攻击仍可绕过。该漏洞影响Pixel和三星S25等机型。
KDE庆祝29周年诞辰并启动年度筹款活动 -- KDE celebrates the 29th birthday and kicks off the yearly fundraiser
KDE庆祝成立29周年,并启动年度募捐活动,目标筹集至少5万欧元以支持其自由软件的开发和维护。KDE软件日益受到游戏玩家、艺术家等群体的欢迎,但相关成本也在增加。捐款将帮助KDE持续发展,确保用户对数字生活的控制权。目前已完成2%的募捐目标。
为何学习编程语言(2022) -- Why study programming languages (2022)
文章探讨了为何要设计新编程语言这一核心问题。作者指出虽然现有语言如C、Java等能完成所有编程任务,但人们仍不断创造新语言,常以抽象性、性能、便利性等主观标准为理由。然而这些标准难以量化,且无法预测语言的实际流行度。作者通过类比创造全新自然语言来解释这一现象,暗示编程语言设计背后存在更深层的逻辑需求。
大模型在字符级文本处理方面表现更优 -- LLMs are getting better at character-level text manipulation
最新一代大语言模型在字符级文本处理能力上有显著提升,如GPT-5和Claude 4.5已能较好完成字符计数、替换及编码解密等任务,而早期模型因分词机制限制常出现错误。这表明LLMs正突破以词元为单位的处理局限,向更精细的字符级操作演进。
当模型连简单指令都难以遵循时,为何还要强推自主代理? -- Why the push for Agentic when models can barely follow a simple instruction?
文章核心内容:作者质疑当前AI模型连简单指令都难以准确完成,却大力鼓吹"自主代理"功能的炒作现象。他以GPT-5和Gemini Pro为例,指出这些模型在修改代码时频繁遗漏细节,认为所谓的"自主代理"只是给用户带来更多麻烦的幻想。