申淇医疗完成数亿元C轮融资,继续领跑介入器械领域
06-17
,医疗AI第一大新闻属于谷歌。
1 月 2 日,Google Health 联合公司旗下 DeepMind、伦敦大学学院、剑桥大学、英国吉尔福德皇家萨里医院、初创公司 Verily Life Sciences、斯坦福医学中心、皇家马斯登医院等英国机构在发表论文杂志,介绍了一种新的深度学习乳腺X线摄影成像系统。
该系统的核心亮点在于,与之前的模型相比,该模型有效减少了乳腺癌误诊或漏诊的病例数,使乳腺癌检测假阳性率降低了5.7%,假阴性率降低了9.4% 。
,并声称击败了6位全职放射科医生。
谷歌经常在某些领域“超越”医生。
在此之前,2016年,谷歌医疗AI在诊断乳腺癌方面超越了人类专业病理学家。
次年,谷歌发布了针对晚期乳腺癌的人工智能检测系统,能够正确区分转移性癌症,准确率高达 99%。
然而,昨天的消息还没有持续48小时,就有大佬站出来质疑。
LeCun问的是什么?深度学习三巨头之一的LeCun首先站了起来。
他纠结的一点是,谷歌论文的结果已经由纽约大学团队在今年 10 月份做出了。
如果谷歌要发表这篇文章,它应该引用纽约大学的研究。
雷锋网查看LeCun的账号发现,直到1月3日中午11点30分,LeCun还在转发帖子。
看来他对这件事有着很深的执念。
当然,这不是谷歌的错。
DeepMind负责人哈萨比斯回复LeCun说,我们引用了这篇论文,LeCun在批评之前应该看清楚结果。
我后来也解释说我确实没有看到这一点。
然而,围绕这篇论文的争议并未消散。
一些学者站出来公开支持LeCun,并质疑这篇论文的实际价值。
(稍后雷锋网将对纽约大学这篇论文进行整理解读)Hugh Harvey表示,虽然我们要祝贺谷歌,但不要忘记纽约大学团队去年取得了更好的成绩,有更多的数据验证,并且更多放射科医生的比较。
此外,纽约大学的代码和数据都是开源的。
上面的话还算客气,但休·哈维的最后一句话却毫不留情:“只是纽约大学的学者没有公关团队来吸引公众的关注。
”当然,有人反对,也有人支持。
巴塞罗那大学机器学习和CV领域教授Gabriel Oliveira表示,如果我们无法访问数据集或代码,我们应该如何重现结果或验证它?尽管如此,任何帮助抗击癌症的进展和努力都是值得欢迎的,所以祝贺谷歌的团队。

2019年,LeCun与Hinton教授、Bengio教授共同荣获图灵奖,并将共同获得1万美元奖金。
虽然名声越来越深,但LeCun始终是一个批评家,经常公开发表不同的意见。
去年在ISSCC(国际固态电路会议)学术会议上发言时,这位“敢于发声、敢于批评”的AI专家批评了英特尔神经拟态计算实验室主任Mike Davies的神经拟态计算。
自然,接下来的事情就引发了一场“空战”。
不过,作为深度学习领域的领军人物,LeCun对于人工智能的未来一直非常谨慎。
“人工智能离我们的目标还很远,达不到我们想要的结果。
”因此,对于谷歌能否击败六位放射科医生,相信LeCun也会有自己的看法。
99%的准备率可靠吗?拆解“知名”医学AI论文的现象一直存在。
雷锋网获悉,今年12月,吴恩达团队宣布,利用CNN算法识别肺炎的准确率超过了人类专业医生。
紧接着,阿德莱德大学放射学系博士生 Luke Oakden-Rayner 发表文章质疑 Andrew Ng 团队的医学影像数据集的可用性。
要知道,当时ChestX-ray14已经是最大的开放胸部X光照片数据集,包含14种疾病的10万张正视X光图像。
为了证明自己的观点,Luke Oakden-Rayner博士依次讨论了三个问题:“标签的准确性”、“标签的医学意义”、“标签对于图像分析的重要性”。
除了数据集之外,AI如何根据人类尤其是医生的思维得出结论,其实更重要。
斯坦福大学皮肤科的Novoa博士也举了一个例子讨论了这个问题:当皮肤科医生检查可能是肿瘤的病变时,他们会用一把尺子——你小学时用的那种——来准确测量它的大小。
尺寸。
皮肤科医生这样做是为了寻找病变。
因此,在一组活检图像中,如果图像中存在尺子,算法更有可能将其判断为恶性肿瘤,因为尺子的存在与病情癌变的可能性相关。
不幸的是,Novoa 强调,算法不知道为什么这种相关性有意义,因此很容易将随机标尺误解为诊断癌症。
如上所述,对于谷歌之前提到的“晚期乳腺癌人工智能检测系统可以在99%的情况下正确区分转移癌”也存在质疑。
我们要知道,计算机工程界常用的评价指标有两个: 准确率:正确样本数与样本总数的比值。
计算方法是系统正确判断的阳性数与系统正确判断的阴性数之和除以样本总数。
精度:系统判定为阳性的案例中正确的比例。
它的计算方法是用系统正确判断为阳性的阳性数除以系统判断为阳性的阳性总数。
召回率:相当于灵敏度。
可以发现,准确率Accuracy和精密率Precision很大程度上依赖于样本总数中正负的比例。
作为一种极端情况,设计一个对所有输入都报告阳性的系统,即灵敏度为%,特异性为0,这是一个没有实际用途的系统。
那么此时抽取的检测样本中,99个为阳性,1个为阴性。
此时计算的准确率是99%,精确率也是99%。
因此,在现实中,很容易制作出高灵敏度和低特异性的系统,反之亦然。
测试样本的正负比可以轻松调整,以优化其准确度和精密度值。
医学是一门强调证据的学科。
如何证明一个临床结果的先进性、实用性和稳定性,需要工程团队给出充分的理由。
就“殴打医生”而言,目前看来还很遥远。
“一目了然”的做法并不适合以“循证”为特征的医学领域。
数据集、思维方式、评估指标都是医疗AI无法回避的问题。
因此,今后我们再看看“准确率超过99%”、“超过医生水平”等类似表述。
毕竟,AI想要达到甚至超过医生的水平,还有很多工作要做。
版权声明:本文内容由互联网用户自发贡献,本站不拥有所有权,不承担相关法律责任。如果发现本站有涉嫌抄袭的内容,欢迎发送邮件 举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。
标签:
相关文章
06-17
06-18
06-17
06-18
06-17
最新文章
Android旗舰之王的过去与未来
智能手表不被开发、AR眼镜被推迟,Meta的产品经历了一波三折
为什么Cybertruck是特斯拉史上最难造的车?
更新鸿蒙3后,文杰允许你在车里做PPT了
新起亚K3试驾体验:追求“性价比”,韩系汽车仍不想放弃
阿维塔15登场!汽车配备了增程动力,理想情况下会迎来新的对手吗?
马斯克宣布创建 ChatGPT 竞争对手! OpenAI的CEO给他泼了冷水, GPT-5可能会发生巨大变化
骁龙无处不在,是平台也是生态