人工智能在疫苗研发中发挥了巨大作用
日期:2021-01-11 09:51:26  发布人:小编  浏览量:

  现代疫苗设计是一项巨大的信息密集型工作。 首先,需要大量数据来了解病毒和人类免疫系统对该病毒的反应。 目前,已知有200多种病毒可感染人类,并且每种病毒的机制,行为和最终治疗方法都不同。 尽管它们在细节上有所不同,但是病毒开始攻击人体的方式基本相同。 当病毒通过口腔或鼻腔进入人体时,它会与细胞表面的受体结合并渗透到健康细胞中。 然后,病毒劫持了细胞机制以自我复制,然后发生了感染。 免疫系统负责预防所有这一切。 它猎杀并消灭引起疾病的病原体,例如病毒和细菌。 第一步,免疫系统将各种基本武器发送给被感染的细胞,这就是所谓的先天免疫反应。 如果这还不足以控制感染,例如,如果我们的身体之前没有识别出这种病原体,并且普通武器不起作用,那么免疫系统的适应性免疫反应将使用更强大的武器。 适应性免疫依赖于两种白细胞-B细胞和T细胞。  B细胞可以产生一种称为抗体的特殊蛋白质,该蛋白质可以与病原体结合并阻止其进入健康细胞。 同时,T细胞可以破坏感染了病毒的细胞,并阻止它们复制更多病毒。 适应性免疫反应需要几天的时间才能开始消灭一种新病毒。 人体中的B细胞和T细胞可以适应世界上几乎所有病原体,但是正确的免疫细胞才能找到入侵者并进行增殖需要时间。 在这段时间里,我们病了。 好消息是,当“战争”激烈时,免疫系统还将产生记忆B细胞和T细胞来记录战争。 如果我们再次暴露于同一病原体,则免疫系统已经准备好了其武器库,并且可以更快地做出反应。 我们可能有轻微症状,或者根本没有症状。 因此,疫苗的目标是使人体暴露于病原体而不会使人生病,从而使免疫系统可以在随后的任何暴露中准备抵抗它。 这可以通过使人体暴露于特定的病毒片段或减弱病毒来实现。 最重要的是,疫苗必须包含病毒抗原的关键部分。 抗原具有免疫原性,这意味着它们可以被B细胞和T细胞识别,从而触发所需的适应性免疫反应。

  面对新的病原体时,疫苗设计人员必须首先了解其中最容易引起免疫原性的部分。 病毒通常由遗传物质(DNA或RNA)组成,并被一层或多层蛋白质包围。 外膜通常含有刺突蛋白,使病毒能够结合宿主细胞上的受体并注入其有效的遗传物质。 因此,刺突蛋白是疫苗的典型靶标。 如果免疫系统可以产生抗体来抑制刺突蛋白,则病毒无法进入细胞。


  但是,对于任何特定的病毒,免疫系统识别的外膜蛋白具有成千上万个不同的亚成分,因此有成千上万种不同的疫苗靶标可能性。 这是人工智能工作的好机会。 机器学习工具可以根据已知病原体的训练数据集来预测免疫系统最可能识别的病毒片段。 利用这些信息,免疫学家可以围绕一系列可能更易于管理的潜在靶标设计疫苗,然后将这些靶标整合到候选疫苗中,并在动物中进行实验以确定它们是否可以触发良好的免疫力。美国免疫学家协会公共政策研究员、弗吉尼亚州诺福克瓦格纳黄斑及视网膜中心(Wagner Macula & Retina Center)医学信息学和人工智能集成主任塔亚布•瓦西姆(Tayab Waseem)说,机器学习会“给你打分,如果各项得分都超过了一定的分数,比如99%,那么我会愿意进行实验室测试”。在疫情暴发后的最初几周,斯坦福大学“以人为本”人工智能研究院(HAI)的罗斯•阿特曼(Russ Altman)和陈斌斌带领的一个计算机科学家团队就利用机器学习这样做了。研究人员利用神经网络算法NetMHCpan-4.0和MARIA,以及一个被称为DiscoTope的线性回归模型,列出了一份最有可能引发这种新型冠状病毒免疫应答的靶点清单。这些靶点或表位是B细胞和T细胞可能识别的病毒成分。正如预期的那样,该系统推荐的许多最佳靶点都在病毒的刺突蛋白上。陈斌斌的团队在一篇发表于预印本服务器bioRxiv的论文中建议,应将这些表位纳入COVID-19疫苗的设计中。“我们很有信心,我们预测的靶点在细胞层面会产生免疫应答。”陈斌斌说,“但细胞反应和临床反应之间还有很大的差距。”

  多年来,人们开发了数十种工具来帮助免疫工作,而陈斌斌的机器学习工具就是其中之一。 据他说,机器学习过去一直是疫苗开发的“最不起眼的小助手”,但是对于新的冠状病毒,“学术界和工业实验室的人们已经进行了更多的计算研究。” 他说:“我怀疑所有开发疫苗的制药公司也都进行过计算分析。”

  在确定了病毒表面的靶标后,研究人员便可以开发疫苗。 例如,如果计划使用灭活的病毒作为疫苗,那么研究人员将在实验室中培养活病毒,并通过加热,辐射或化学方法杀死活病毒,以使它们在注入人体后无法复制。 然后,研究人员必须确保杀死病毒时不会损坏关键的免疫原性成分,因为这些部分必须完整无损才能引发免疫反应。 下一步是在实验室中测试疫苗,然后在小动物上测试,最后在人类上测试。


  要训练软件来筛选病毒目标,重要的是首先了解病毒蛋白质的三维结构。 病毒蛋白由称为氨基酸的线性化学链组成,该链自动折叠成紧密的带状结构。 疫苗开发人员必须选择从病毒外表面朝外的目标,以便免疫系统的武器可以攻击它们。 流行病爆发时,瑞士巴塞尔大学的研究人员使用一种名为Swiss-Model的蛋白质建模工具来预测SARS-CoV-2病毒外表面的蛋白质结构。 后来证明,他们的预测与病毒的实际蛋白质结构一致。 同样,总部位于伦敦的人工智能公司DeepMind也使用其神经网络AlphaFold根据病毒的基因序列预测SARS-CoV-2蛋白的三维形状。

  尽管取得了这些成功,但并非所有研究人员都对人工智能在疫苗开发过程中的作用持乐观态度。 他们相信,无论是否使用人工智能,基于对其他冠状病毒的理解和对SARS-CoV-2的实验研究,可以知道刺突蛋白是一个明显的靶标。  Distributed Bio公司的Granville说:“有很多方法可以识别病原体的免疫原性区域。 这些方法不需要人工智能。” 他说,拥有可以预测这些目标的算法是很好的,但对于COVID-19,可能没有必要。 他指出:“人工智能仍然面临挑战,需要证明它比简单方法更有效。” 例如,血清筛查,表位作图和结构生物学。但是,人工智能在针对病毒的免疫原性位点方面也可以发挥更多的作用。 许多疫苗开发人员已经在使用计算工具来设计和合成DNA疫苗的遗传成分。 圣地亚哥的公司就是其中之一。 该公司是进行COVID-19疫苗人体试验的34个研发组织之一。  “ Inovio的研究团队急切地等待病毒遗传序列在线发布。”  Inovio研发部门高级副总裁Kate Broderick说。  “中国机构于1月10日上传了该序列后,我们的科学家立即输入了该序列。在我们的算法中,他们在3个小时内就拥有了一种经过全面设计和优化的DNA药物疫苗。” 她说。  Inovio的DNA疫苗通过模仿病原体的部分遗传序列来发挥作用。 这些核酸疫苗包含DNA或RNA形式的遗传指令片段,这些片段指定了病毒关键免疫原性成分的遗传密码。 当核酸进入人体细胞时,细胞产生抗原,从而触发免疫反应。 根据先前对其他冠状病毒的研究,Inovio的研究人员知道SARS-CoV-2的突触蛋白很可能引起免疫反应。 因此,病毒基因组的这一区域成为其疫苗开发的起点。 有许多方法可以编写可产生相同蛋白质的DNA序列。 为了找到最有效的疫苗方法,有必要将其他遗传和分子成分结合起来共同增强这一遗传密码。 在Inovio获得专利的遗传优化算法的帮助下,研究人员学会了如何制作疫苗来刺激以这种方式大规模产生免疫原性刺突蛋白。  Broderick说Inovio的COVID-19疫苗从实验室到诊所只用了83天。 她和她的同事在今年5月发表于《自然通讯》上的一项研究表明,这种疫苗在动物身上表现良好。 该公司在6月下旬宣布,在美国进行的一项测试证明该疫苗是安全的,并且似乎可以刺激40名健康人的免疫反应。  7月底,来自Inovio的一份报告表明,该疫苗还为接种疫苗后暴露于该病毒的猴子提供了4个月的保护。 与病毒的遗传变化同步也给计算机分析带来了挑战。 病毒以微小的方式不断变异,因此必须在病毒基因组中相对稳定的区域周围设计疫苗,这些区域是病毒遗传密码中不会变异的区域。  Wagner的黄斑和视网膜中心的Wasim说:“病毒表面蛋白的某些部分具有很高的代谢率。 这只有在对病毒进行测序后才能发现,并且病毒结构也会随着其突变而改变。 在过去的10个月中,已经对从世界各地患者那里收集的成千上万个病毒样本进行了基因测序,并上传到了德国全球流感数据共享倡议组织托管的在线数据库中。这些序列的算法比较可以 揭示病毒基因组中哪些部分经常改变,哪些部分不经常改变,随着病毒继续在新领域造成破坏,研究人员将密切注意这个不断变化的敌人。


  所有这些任务都需要大量的计算能力。  2020年3月,白宫宣布将与公共和私人团体合作,为世界各地的研究人员提供最强大的超级计算机,以“迅速推进有关治疗选择和疫苗的科学研究”。 这个名为“(高性能计算联盟)的项目”包括来自美国能源部国家实验室以及几所大学和私营公司(例如IBM和惠普企业)的资源。该联盟有将近80个正在运行的项目,可以实现更多目标。 超过400 petaflops的浮点计算能力,阿肯色大学费耶特维尔分校的计算化学家Mahmoud Moradi领导了其中一个项目,他使用了得克萨斯州高级计算中心的超级计算机来创建新的冠状病毒峰值的三维增强模拟 仿真结果表明,与2003年在亚洲爆发的冠状病毒相比,这些刺突蛋白具有活性,可以更快地感染人细胞。Inovio的Broderick表示,这类研究对于疫苗开发团队至关重要。 学习大量相关信息以帮助疫苗设计。 她说:“与此同时,我们也可以了解这种病毒的致病机制。  “一旦设计出候选疫苗,大部分工作将转移到试验中。该疫苗将首先在实验室中进行细胞和动物测试,然后将对更多的人进行临床试验。在美国批准该疫苗之前 监管机构将为成千上万的测试志愿者接种疫苗,不幸的是,人工智能工具无法替代那些耗时的步骤,它们可能能够预测免疫系统会看到哪些抗原,但免疫系统实际上会对免疫系统产生什么样的反应。 人体已经超越了当今的计算机功能。艾伦人工智能研究所的首席执行官Oren Etchioni说:“人体非常复杂,我们的模型可能无法可靠地预测这种分子或疫苗对人体的影响 这就是为什么我们必须进行这些缓慢而困难的实验,而我们的预测模型不足以提供可靠的数据。

  尽管人工智能无法预测人类试验的成功,但它可以查看所有参数并找到人脑可能无法检测到的模式,从而了解这些试验中的大量数据。 随着候选疫苗进入临床试验的第二和第三阶段,成千上万的患者将参与其中,而人工智能系统将成为快速分析临床和免疫数据的关键。 越来越多的研究人员正在进行研究,并且有越来越多关于新冠状病毒的文献。 科学家需要外部帮助来组织这些论文。 艾伦研究所开发了一种称为CORD-19的资源,该资源以机器可读格式提供了有关COVID-19的13万多篇学术文章。 其中,Kaggle社区已使用这些数据集创建了多个人工智能系统,可以帮助研究人员跟上文献的更新速度,并回答高优先级的研究问题。 艾乔尼说:“我相信,无论是用于搜索文献还是分析实验数据,人工智能都将在10年内成为医学研究人员工具包中不可或缺的一部分。” 当下一次大流行发生时(总计将发生下一次大规模流行病),研究人员将准备释放致命病原体的秘密,设计许多可能的疫苗来保护我们,并迅速找到疫苗来预防诸如COVID-19等灾难 再次来到人类。


核发:小编 点击数: 收藏本页