橡树岭国家实验室在量子生物学和人工智能方面的研究大大提高了CRISPRCas9基因组编辑在微生物中的效率,有助于可再生能源的开发。
橡树岭国家实验室(ORNL)的Ezoic科学家们利用他们在量子生物学、人工智能和生物工程方面的专业知识,改进了CRISPRCas9基因组编辑工具在微生物等生物体上的工作方式,这些生物体可以被改造以生产可再生燃料和化学品。
CRISPR是一种强大的生物工程工具,用于修改遗传密码,以提高生物体的性能或纠正突变。CRISPRCas9工具依赖于单一、独特的引导RNA,引导Cas9酶与基因组中相应的目标位点结合并裂解该位点。现有的用于计算预测CRISPR工具有效引导RNA的模型仅建立在少数模式物种的数据基础上,应用于微生物时效率较弱且不一致。
"许多CRISPR工具都是针对哺乳动物细胞、果蝇或其他模式物种开发的。"ORNL合成生物学小组组长卡莉-埃克特(CarrieEckert)说:"CRISPR工具很多都是针对哺乳动物细胞、果蝇或其他模式物种开发的,很少有针对微生物的,因为微生物的染色体结构和大小都非常不同。我们观察到,设计CRISPRCas9机器的模型在与微生物合作时表现不同,这项研究验证了我们的传闻。"
为了改进导引RNA的建模和设计,ORNL的科学家们试图更好地了解细胞核中最基本的情况。他们求助于量子生物学,这是一个连接分子生物学和量子化学的领域,研究电子结构对核苷酸(DNA和RNA的组成分子)的化学性质和相互作用的影响。
ORNL的计算系统生物学家EricaPrates说,电子在分子中的分布方式会影响反应性和构象稳定性,包括Cas9酶指导RNA复合物与微生物DNA有效结合的可能性。
在CRISPR研究中利用可解释人工智能
科学家们建立了一个名为迭代随机森林的可解释人工智能模型。他们在《核酸研究》(NucleicAcidsResearch)杂志上介绍的一种方法中,以大肠杆菌基因组为目标,在约5万个引导RNA的数据集上训练了该模型,同时还考虑了量子化学特性。
该模型揭示了核苷酸的关键特征,有助于选择更好的导向RNA。普拉茨说:"该模型帮助我们找出了支撑我们的导向RNA效率的分子机制的线索,为我们提供了一个丰富的分子信息库,可以帮助我们改进CRISPR技术。"
ORNL的研究人员通过在大肠杆菌上使用该模型选择的一大批引导RNA进行CRISPRCas9切割实验,验证了可解释人工智能模型。
论文第一作者、前ORNL计算系统生物学家贾克琳-诺谢(JaclynNoshay)说,使用可解释人工智能让科学家们了解了驱动结果的生物机制,而不是植根于缺乏可解释性的"黑箱"算法的深度学习模型。
Noshay说:"考虑到跨[生物]王国训练的模型不兼容的知识,我们希望提高对以微生物物种为重点的最佳切割效率的指导设计规则的理解。"
可解释的人工智能模型具有数千个特征和迭代性质,是利用ORNL橡树岭领导计算机设施(OLCF)的Summit超级计算机训练出来的,OLCF是能源部科学办公室的用户设施。
埃克特说,她的合成生物学团队计划与ORNL的计算科学同行合作,利用他们从新的微生物CRISPRCas9模型中学到的知识,并利用实验室实验或各种微生物物种的数据对其进行进一步改进。
为不同物种开发CRISPRCas9工具
将量子特性考虑在内,为每个物种的Cas9引导改进打开了大门。埃克特说:"这篇论文甚至对人类也有影响。如果你正在研究任何类型的药物开发,例如,你正在使用CRISPR来靶向基因组的特定区域,你必须有最准确的模型来预测这些引导。"
完善CRISPRCas9模型为科学家们提供了更高通量的管道,将基因型与表型或基因与物理性状联系起来,这一领域被称为功能基因组学。这项研究对ORNL领导的生物能源创新中心(CBI)的工作具有重要意义,例如改进生物能源原料植物和生物质的细菌发酵。
埃克特说:"通过这项研究,我们大大改进了对导核糖核酸的预测。我们对起作用的生物过程了解得越多,能够输入到我们预测中的数据越多,我们的目标就会越好,从而提高我们研究的精度和速度"。
"我们研究的一个主要目标是提高利用CRISPR工具预测性修改更多生物DNA的能力。这项研究表明,我们在了解如何避免在生物体的遗传密码中出现代价高昂的'错别字'方面取得了令人兴奋的进展。"ORNL的生物分析化学家保罗-亚伯拉罕(PaulAbraham)说,他是能源部基因组科学计划安全生态系统工程与设计科学重点领域(SEEDSFA)的负责人,该领域为CRISPR研究提供了支持。"我很想知道,随着我们生成更多的训练数据,并继续利用可解释的人工智能建模,这些预测还能提高多少"。
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】