Hacker News 中文摘要

文章摘要

该研究探讨了利用可穿戴设备的行为数据构建基础模型，以提升健康预测的准确性。相比传统传感器数据，行为数据能更全面地反映用户健康状况，为个性化健康管理提供新思路。

文章总结

标题：超越传感器数据：基于可穿戴设备行为数据的基础模型提升健康预测

主要内容：

可穿戴设备能够记录生理和行为信号，这些数据可以用于改善健康预测。尽管基础模型在此类预测中应用日益广泛，但它们主要针对低级别的传感器数据，而行为数据往往更具信息量，因为它们与生理相关的时间尺度和量级更为一致。本文开发了一种基于行为信号的基础模型，使用了来自162,000名个体的超过25亿小时的可穿戴设备数据，并系统优化了模型架构和标记化策略，以适应这一独特的数据集。

该模型在57项健康相关任务中表现出色，涵盖了个体分类和随时间变化的健康状态预测等多种实际应用。特别是在行为驱动的任务（如睡眠预测）中，模型表现尤为突出，并且在与原始传感器数据的表征结合后，预测效果进一步提升。这些结果表明，为基础模型设计量身定制的方法对于可穿戴设备数据的处理至关重要，并展示了其在推动新健康应用方面的潜力。

发表信息：
该论文已被ICML 2025会议接受，并于2025年6月30日提交至arXiv平台。

评论总结

评论内容总结：

技术创新与准确性
- 评论1指出，2025年苹果的论文在可穿戴设备基础模型上进行了更高层次的创新，通过行为生物标志物（如心率变异性、静息心率等）进行训练，而非原始传感器数据，并在检测糖尿病、心力衰竭、睡眠呼吸暂停等疾病上表现出高准确率（83%-90%）。
- 引用：“The innovation of this 2025 paper from Apple is moving up to a higher level of abstraction.”
- 引用：“They find high accuracy in detecting many conditions: diabetes (83%), heart failure (90%), sleep apnea (85%), etc.”
数据开放性与应用
- 评论2、3、4关注模型的开放性和数据使用问题，询问是否可以在个人数据上运行、是否发布权重或API，并指出缺乏开放权重和数据是主要问题，导出Apple XML数据可能涉及临床研究的数据安全和去标识化要求。
- 引用：“Is there a way to run this on your own data?”
- 引用：“the big problem is no open weights, nor open data.”
模型性能质疑
- 评论7对模型性能表示失望，指出在大多数情况下，基础模型的表现甚至不如仅使用非特定人口统计数据的基线预测器，且即使表现更好，也只是略微提升。
- 引用：“The foundation model... actually underperformed the baseline predictor.”
- 引用：“even when the wearable foundation model was better, it was only marginally better.”
个人数据分析与工具
- 评论8分享了个人长期收集的Apple Health + Fitness数据，并寻求使用R或Python进行纵向分析的建议。
- 引用：“I have about 3-3.5 years worth of Apple Health + Fitness data.”
- 引用：“Has anyone done something similar? Perhaps in R, Python?”
技术细节与疑问
- 评论5询问“可穿戴基础模型”的含义，评论6提到对比损失函数的使用，而非重建损失。
- 引用：“Can someone explain what "wearable foundation" means?”
- 引用：“Interesting to see contrastive loss instead of a reconstruction loss.”

总结：评论主要围绕苹果可穿戴设备基础模型的技术创新、数据开放性、性能表现、个人数据分析需求以及技术细节展开，既有对高准确率的认可，也有对模型开放性和性能的质疑，同时反映了用户对个人数据分析工具的兴趣。

超越传感器数据：可穿戴设备行为数据的基础模型 -- Beyond sensor data: Foundation models of behavioral data from wearables

文章摘要

文章总结

评论总结