文章摘要
研究发现,AI在乳腺癌筛查中漏诊率近三分之一,表明当前技术仍存在明显局限,需结合其他检测方法提高准确性。
文章总结
研究显示AI漏诊近三分之一乳腺癌病例
一项新研究对人工智能在乳腺癌检测中的可靠性提出质疑,发现当前AI工具可能漏诊近三分之一的癌症病例。但研究人员表示,一种特殊的MRI技术可能有助于弥补这一缺陷。
该研究回顾了414名平均年龄55.3岁的乳腺癌患者,评估了基于AI的计算机辅助诊断系统(AI-CAD)在解读乳腺X光片和MRI扫描时的表现。结果显示,AI系统漏诊了127例癌症,占总病例的30.7%。研究发现两个主要漏诊因素: 1. 致密乳腺组织:会掩盖影像中的肿瘤 2. 小肿瘤尺寸:特别是≤2cm的肿瘤漏诊率高出近5倍
研究人员测试了弥散加权成像(DWI)技术作为解决方案。这种快速、无需造影剂的MRI技术通过检测水分子在组织中的运动来识别癌症。两位放射科医生仅通过DWI图像就识别出AI漏诊的大部分癌症: - 医生A检出率:83.5% - 医生B检出率:79.5%
DWI对>1cm的肿瘤和X光不可见的肿瘤效果最佳,但对<1cm的微小病灶准确性下降。
专家指出,虽然AI正成为乳腺影像学的有力工具,但并非万无一失。结合DWI技术可形成有效的安全网,尤其对致密乳腺女性更有价值。不过研究存在局限性: - 仅纳入已确诊患者 - 单中心研究
作者呼吁开展多中心前瞻性试验,以验证DWI能否可靠提升AI辅助的乳腺癌检测效果。
参考文献
Kim JY等.《弥散加权成像在AI乳腺X光检查漏诊中的附加价值》.《放射医学》2025年
DOI:10.1007/s11547-025-02161-1
(注:原文中大量关于网站功能、导航菜单、cookie政策等无关内容已删除,仅保留核心研究发现。)
评论总结
以下是评论内容的总结:
对AI检测效果的质疑
- 评论指出仅提供单一数字(如2/3检出率)无实际意义,需展示混淆矩阵等完整数据(评论2:"Please always present the confusion matrix. One number is (almost) useless.")
- 研究设计存在局限:仅回顾性分析已知癌症患者,缺乏健康对照组,无法计算假阳性率(评论3:"zero false negatives and zero true negatives";评论8:"no false positive rate")
AI与人类医生的对比争议
- 研究仅对比2名放射科医生与单一模型,样本量小且未采用盲测,结论可靠性存疑(评论9:"They only tested 2 Radiologists... the results don’t say anything about how Radiologists in general perform")
- 人类医生在辅助技术(如DWI)下可补充AI漏诊,但仍有约20%未检出(评论5:"The combination of AI and DWI... still about 20% of 1/3 gets missed")
对标题和结论泛化的批评
- 标题将"AI"泛化为单一实体不妥,应强调具体模型(评论7:"The title bothers me. It suggests 'AI' is a single thing";评论10:"'AI' doesn't exist. There are hundreds of algorithms")
- 个别模型表现差不能否定AI整体潜力(评论16:"'One AI is not great' is not conclusive";评论14:"Not all AIs are created equal")
研究价值与传播争议
- 部分认为此类负面结果无公共传播价值(评论12:"a needlessly publicized finding... You only need 1 good system to adopt")
- 反驳称敏感性数据仍有参考意义(评论11:"Measuring sensitivity only is still a useful thing")
情感化反应与期待
- 极端观点将AI漏诊类比为"杀人"(评论13:"AI kills people... This is Skynet")
- 更多声音呼吁关注实际医疗影响(评论15:"how this compares to humans... women whose lives were deeply affected")
关键分歧点:研究设计是否支持"AI检测能力不足"的结论,以及标题是否误导性泛化。多数评论强调需区分具体模型与AI整体,并完善对比实验设计。