帕金森病(PD)的增长速度比任何其他神经系统疾病都要快,这使得其早期检测如此重要。研究人员已经开发出一种新的机器学习工具,显示出作为早期检测该疾病的一种方式的前景。PD的诊断通常发生在一个人出现传统症状的时候:运动缓慢、震颤、平衡和协调能力差以及肌肉僵硬。
但非典型症状的出现,如疲劳、睡眠困难、膀胱或肠道问题、抑郁和/或焦虑,以及嗅觉丧失,可能比传统的PD症状早很多年。一种可靠的生物标志物测试方法,导致PD的早期诊断,而不是等待传统症状的出现,将意味着该疾病的治疗可以提前开始。
现在,新南威尔士大学悉尼分校的研究人员与波士顿大学合作,利用机器学习的力量开发了一种工具,显示出作为PD早期检测器的前景。
机器学习被广泛用于开发疾病预测的精确模型。而先进的机器学习方法,如神经网络,是处理大量数据的一种方式。然而,为了有效,机器学习算法需要使用没有"噪音"的数据进行教学。代谢组学,对代谢物的大规模研究,在这方面可能存在问题。
许多代谢物--当身体分解食物、药物和化学品时产生的副产品--与其他代谢物相关,其中一些对疾病预测没有重大贡献。这就是为什么研究人员开发了一个新的机器学习工具,即使用神经网络生成的质谱知识的分类和排名分析或CRANK-MS。
"为了弄清楚哪些代谢物对疾病与对照组更有意义,研究人员通常会研究涉及特定分子的相关性,"该研究的主要作者JDianaZhang说。"但在这里,我们考虑到代谢物可能与其他代谢物有关联--这就是机器学习发挥作用的地方。面对成百上千的代谢物,我们利用计算能力来了解发生了什么。"
研究人员从西班牙欧洲癌症和营养前瞻性调查(EPIC)中获得了代谢组数据,重点是39名已经发展成PD的患者,并通过CRANK-MS进行了分析。在将PD患者与健康患者进行比较后,研究人员能够确定独特的代谢组合,这些组合可能是该疾病的早期预警信号。
使用CRANK-MS的好处是,研究人员可以使用不含杂质的数据,这简化了过程。
该研究的通讯作者WilliamDonald说:"通常情况下,使用机器学习来检查代谢物和疾病之间的相关性的研究人员首先减少化学特征的数量,然后再将其输入算法。但在这里,我们把所有的信息都输入了CRANK-MS,而没有在一开始就进行任何数据缩减。由此,我们可以得到模型预测,并确定哪些代谢物对预测的影响最大,所有这些都在一个步骤中完成。这意味着,如果有一些代谢物可能在使用传统方法时被遗漏,我们现在可以把它们找出来。"
虽然CRANK-MS能够分析指示PD的代谢物,准确率高达96%,但研究人员明白,该研究的小样本量意味着需要进一步研究。
研究人员说,在未来,CRANK-MS可以在出现不典型症状的第一个迹象时使用,以确保早期诊断PD或排除它。而且机器学习算法是公开的,可供那些可能想使用它的研究人员使用。
Zhang说:"我们以这样一种方式建立了这个模型,它适合于目的。应用CRANK-MS检测帕金森病只是一个例子,说明人工智能可以改善我们诊断和监测疾病的方式。令人激动的是,CRANK-MS可以很容易地应用于其他疾病,以确定新的感兴趣的生物标志物。"
该研究发表在ACS中央科学杂志上。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】