声明:本文来自于微信公众号 差评(ID:chaping321),作者:差评,授权站长之家转载发布。
不知道大伙们还记得,那名用50张1080TI 显卡对抗癌症的“ 业余 ”程序员不。
他曾自掏腰包训练了个 AI ,还整了个免费的网站,让人工智帮你“看片子”,能快速诊断出乳腺癌。
当时差评君就在畅想,未来,AI 技术在医学领域,铁定能溅起不小的水花儿。
但谁也没想到,这未来来得实在有些快,而且比起水花,AI 掀起的更像是大浪。
这不在前不久,医学顶刊Nature Medicine上就登了一篇论文,说是用AI大模型+简单的平扫CT,就可能大规模地筛查出早期胰腺癌了。
这消息,直接就在医学圈儿炸开了。
Nature Medicine 就罕见地附带了一篇评论文章,标题是这样的:在AI 加持下的医疗影像,即将迎来黄金时代。
各大媒体也都争相报道,“突破难题”“人类首次”等赞美之词毫不吝啬。
而如果用一句话,来形容这技术的含金量的话。
差评君觉得比较贴切的是:放在过去,这事儿想都不敢想。
这么说吧,这次的大反派“胰腺癌”,在所有癌症里有个可怕的名字——“癌症之王”。
只要确诊胰腺癌,几乎就是被判了死刑,近90%的人在确诊胰腺癌后,活不过5年,这在癌症里算是一个相当可怕的数字了。
好多名人像吴尊友、帕瓦罗蒂等都是因为胰腺癌去世的。
死亡率这么高的原因,在于胰腺癌早期太难被发现了,一旦发现,大概率就是晚期。
因为胰腺这玩意儿,位置非常隐蔽,藏在胃后面,被十二指肠、脾脏和肝脏等器官包围住了。
而我们一般去医院体检的项目,像超声、平扫 CT 等等这些,很难发现早期胰腺癌的特征。
当然,增强 CT 或者是增强核磁共振,能把胰腺看得更清楚些。
但胰腺癌的发病率其实并不高,在所有癌种中只排在十名开外。
所以考虑到辐射、医疗资源挤兑等问题。。。为了胰腺,每个人每年都去做增强 CT 或增强核磁共振,其实划不来。
图源备注:图片由AI生成,图片授权服务商Midjourney
基本上只有病人发现了异样,才会去做这些项目。
但在症状上想发现早期胰腺癌,也很难行得通。
前期患者们的症状一般是恶心、呕吐、身体虚弱等,这和普通生病的症状没啥两样,医生们很容易就会被“忽悠”。
并且癌变会影响胰腺功能,早期胰腺癌还很可能伪装成糖尿病。。。
于是在影像+症状双重Debuff的情况下,想大规模筛查早期的胰腺癌就变成了一件难上加难的事。
所以这些年来,医学界为了能早点发现胰腺癌,可脱了不少发、秃了不少聪明脑瓜,但最后的成果呢,寥寥无几。
前些年,业内还有个很火的滴血验癌( ctDNA ),一度被大家看好,它是从患者的血液里找有没有癌症的碎片。
但这个方法,同样也很难发现癌症一期、二期的血液碎片,到现在快十年过去了,依旧没啥进展。
而这次,研究人员们想到了用 AI 大模型,来解这道题。
差评君也去到 Nature Medicine 官网上,翻了翻论文原文,有一说一,它还真有可能在早筛胰腺癌这块豁出个口子。
这次,他们整出了个名叫PANDA(pancreatic cancer detection,withartificial intelligence)的AI大模型,根据简单的平扫 CT 图像,它就能做出胰腺癌相关的诊断。
这么说吧,在临床验证中,研究团队试验了两万多个病例,PANDA几乎就没咋漏诊,99.9%有胰腺癌的都给诊断出来了。
偶尔有一些误诊,也都是很容易排除的病变,像什么脂肪浸润、胃肠内容物等,医生简单审核下就能排除掉。
而用AI这点子,最早是上海市胰腺疾病研究所的曹凯医生(也是这篇论文的共同第一作者)想到的。
在他身上还有这么一小段故事,在大学期间,曹凯的实习导师也因胰腺癌去世,和很多患者一样,他在确诊的时候就已经是晚期了。
不过后来他在整理导师的病例资料时发现,在确诊十个月前,导师就曾做过一次平扫 CT 。
虽然当时没发现什么苗头,但带着结论回过头来分析,就能隐约看到到胰腺那里有病变的迹象。
在这样一个契机下,曹凯就想,既然人眼很难识别到平扫 CT 图像里,早期胰腺癌病变的迹象,那不如借助 AI 帮医生先筛查一遍。
后来,他遇到了达摩院医疗 AI 团队负责人吕乐,他们两个在这块不谋而合,这才有了现在的 PANDA 模型。
PANDA 帮忙筛查胰腺癌的过程说起来也很简单,和医生看片子也没啥两样。
不过它凭借强大的算法,注意到的细节比医生肉眼看到的多得多,自然也能顺利找到疑似病变的地方。
但要练好这么一个 AI ,可不是动动嘴皮那么容易的事。
它不像语言模型出错了打个哈哈就能过去,PANDA对准确性的要求非常高。
而判断它看病好不好,还有两个维度,一个是特异性,一个是敏感性。
要是特异性高了,就很容易漏诊,敏感性高了,又会误诊。
而调这个漏诊、误诊的“天平”,归根结底,还得看喂给模型的数据集和训练模型的方法。
先是数据集,都说宠物毛发顺不顺还得看主人喂什么,在训练模型上也是同样的道理。
这块研究团队是下了血本,他们召集了来自各个医院的48个医生,一共收集了3000个病人的腹部CT图像。
其中有大概2200多个胰腺癌患者,和将近1000个非胰腺癌的病人。
这3000个病人的数据,都是医生们自己一个个手动标注的。
并且因为平扫CT图的对比度太低,手动标注不太现实,所以他们都是在患者的增强 CT 图上标注。
标注的过程也是相当专业,医生们要勾画每一层 CT 图上肿瘤的二维图像,每张有十多二十层,非专业人士是一点都干不了。
画出来的十多张二维图像,叠加起来差不多就是整个肿瘤的三维图。
要喂的数据准备好了,接下来就是选择模型+训练。
研究团队先是搞了个配准算法,把之前标注的增强CT数据迁移到平扫CT图上,让AI学会看平扫的 CT 影像。
后面,就是重头戏了,虽说在医学领域3000个数据已经算是相当多了,但对于深度学习来说这些量就是中规中矩。
所以他们只好在模型算法上更下功夫,好找补回来一些。
据达摩院团队的张灵介绍,在选择模型的时候,他们团队先先后后试了好多种技术路线,最后搞出了一个“混合版”的模型,集分割、检测和分类功能于一身。
而且这三个功能还不是各干各的,而是层层递进、环环相扣。
就拿正常的一套完整的检测流程举例。
PANDA 在拿到平扫 CT 图之后,先会用分割功能在整张图像中找到胰腺的位置。
找到胰腺后,再启动检测功能,去看胰腺里有没有啥不对劲的地方。
要是找到有异常的地方,就用第三步的分类功能,去识别这情况属于哪种胰腺病变。
靠着这套模型和算法,PANDA也开始在临床试验中,不断迭代和更新。
这个过程就是个典型的“出错—反馈—纠错”的循环了,前前后后研究团队大概花费了有一年的时间。
算法修正倒不是什么大问题,比较麻烦的是前期的反馈:要怎么修改这个 AI 。。。
就拿期间的一个例子来说, PANDA 有时会把脂肪浸润的情况检测出来。
光是这个情况,研究团队就和医生们讨论了三个月,要不要让它这么“敏感”,纠结了几次最后才毙掉了。
当然,虽说PANDA的准确性已经相当高了,但在实际的检测过程中,它只能起到一个初筛的作用。
它把医生们看不到的病变找出来后,还是得让医生们再次把关,确保没有误诊啥的。
去年 PANDA 模型已经成功上线,一些医院以及体检中心已经在用这个 AI 帮忙筛查了。
根据张灵的说法,到现在为止,他们已经用PANDA模型帮忙筛查了超过了50万个人。
并且这里面,还成功发现并救治了两个临床漏诊的胰腺癌患者。
其中有一个人,每年都会去医院的体检中心定期体检,当时他在体检时并没发现什么异常。
结果七个月后,在 PANDA 进行临床试验的时候,他的 CT 图被检测出了有95%的概率是胰腺神经内分泌肿瘤。
后来,医院直接找来他,用增强磁共振检查了一通,发现 PANDA 还真没判断失误。
幸好肿瘤还在早期,早早手术割掉了,后续检查时也没再复发。
现在,研究团队也还没停下来,他们还想着进一步拓宽 PANDA 的筛查范围。
张灵透露道,眼下在考虑的,是要不要把囊肿加到 PANDA 的检测范围内。
在未来,他们还打算把更多的癌症、甚至慢性病都纳入进来,让大家只要在体检的时候做一次平扫 CT ,医生通过 AI 辅助,就能看出这些疾病的苗头。
或许有一天,在这个 AI 的协助下,所有的癌症,都能通过一次简单的平扫 CT 在早期被发现。。。
最后,我觉得穆克吉写的《重病之王·癌症传》中的一段话,还挺应景的:
为了追上这种疾病的步伐(癌症),人类一而再、再而三地创造、学习新知识,扬弃旧策略。我们执着地与癌症进行抗争,时而精明,时而绝望,时而夸张,时而猛烈,时而疯狂,时而凛然。这场战争,人类已经持续了数千年。
而差评君也希望,在这次 AI 开辟的“新战场”上,人类可以彻底降伏癌症这头猛兽。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】