构建堆栈:为预训练装载30PB硬盘 -- Building the heap: racking 30 petabytes of hard drives for pretraining
文章介绍了团队在旧金山建立存储集群以存放9000万小时视频数据,用于模型预训练。相比文本数据,视频存储需求高出500倍。通过自建存储而非使用AWS,年成本从1200万美元降至35.4万美元。由于训练数据可容忍部分损坏,团队无需云服务的高可靠性保障,从而大幅降低成本。
光标 1.7 -- Cursor 1.7
Cursor 1.7版本新增了AI代理自动补全功能,可根据近期修改提供建议;推出Hooks测试版,支持通过脚本自定义代理行为;新增团队规则功能,可统一管理项目设置;提供可共享的深度链接;改进了沙盒终端安全性,限制非许可命令的执行权限。
Databricks智能Kubernetes负载均衡 -- Intelligent Kubernetes Load Balancing at Databricks
Databricks针对Kubernetes默认负载均衡在高性能服务通信中的不足,开发了智能客户端负载均衡系统。该系统优化了流量分配,降低了延迟,提升了gRPC等持久连接场景下的服务间通信可靠性,同时保持了对用户的透明性。
展示HN:自闭症模拟器 -- Show HN: Autism Simulator
这篇文章介绍了一个自闭症模拟器,让用户体验自闭症软件工程师在职场中的处境。玩家需要隐藏真实感受,模仿他人期望的社交行为来保住工作,这种"伪装"会带来巨大压力和消耗。尽管表面看起来正常,内心却备受煎熬,展现了自闭症患者在非包容环境中的生存困境。
PWA 最小化文件与配置 -- Minimal files and config for a PWA
该项目是一个极简的渐进式网页应用(PWA)模板,提供了最基础的文件和配置,帮助开发者快速构建PWA应用。
检测Mac上未更新以修复系统全局卡顿的Electron应用 -- Detect Electron apps on Mac that hasn't been updated to fix the system wide lag
这篇文章介绍了一种方法,可以检测Mac上尚未更新修复系统卡顿问题的Electron应用。
我只用Google表格 -- I only use Google Sheets
作者反思自己工作中过度追求复杂解决方案的教训,认为Google表格是最简单高效的解决工具。他列举了浪费数月开发管理系统的失败案例,强调应根据实际需求选择最简单的工具,在业务变化时再评估升级方案。
高分辨率高效WiFi映射图像生成 -- High-resolution efficient image generation from WiFi Mapping
该研究提出了一种利用预训练潜在扩散模型从WiFi信道状态信息(CSI)高效生成高分辨率图像的方法,能够实现高质量的图像重建。
按“使用频率”而非“主题”整理Slack频道 -- Organize your Slack channels by "How Often", not "What"
文章建议将Slack频道按阅读频率(如"立即阅读"、"每小时阅读"等)而非主题分类,这样能优先处理紧急信息,减少压力并提高效率。作者通过实践发现这种方法能更好地管理精力,确保重要事项优先处理。
虎甲虫是最有趣的数据库 -- TigerBeetle is a most interesting database
TigerBeetle是一款与众不同的数据库,它反其道而行:注重代码质量而非速度,完全基于确定性模拟测试,零依赖。它采用静态内存分配,生产环境保留断言,选择Viewstamped复制而非Raft,使用Zig语言而非Rust。其创新设计包括面向借贷而非SQL的事务处理、默认分布式架构、存储容错能力,以及独特的VOPR测试集群。