Science:机器学习模型发现新冠病毒新变种,AI精准预测哪种毒株来势汹汹
新智元报告
编辑:时间
[新智元简介] 科学家们开发出了PyR0模型,从此,新冠肺炎变体不再令人困惑。
目前,新冠肺炎的适应性增强,突变株反复出现。
因此,科学家们开发了一个机器学习模型,并分析了超过600万个新冠肺炎样本的基因组。
基于此,我们可以预测哪些病毒变种将占主导地位,并可能引发新的疫情。
该研究成果发表在5月24日的《科学》杂志上。
地址:https://www.science.org/doi/10.1126/science.abm1208#con13
PyR0模型
为了快速检测和识别新的谱系,科学家们开发了这种名为PyR0的模型。
该模型包含3,000个聚类,来自1,544个PANGO家系和2,904个非同义突变。
通过该算法,1544个盘古谱系被细化为3000个更精细的聚类。
研究人员使用了全球流感数据共享倡议的数据库。截至2022年1月,新冠肺炎基因组超过600万,机器学习模型得到训练。
这对于指导应对疫情至关重要!因为当一个突变菌株出现时,可以快速确定这种谱系,准确预测其动态。
PyR0是一个分层贝叶斯回归模型,可用于所有公开可用的病毒基因组的可扩展分析,并可应用于任何病毒基因组数据集。
然而,当前新冠肺炎的特点是出现了具有更高适应能力的新一代,这推动了重复病例的浪潮。
所谓病毒适应度,包括基本繁殖数、逃避已有免疫的能力和世代时间。
训练好的模型可用于推断系谱适应性和估计个体突变对适合度的影响。
研究发现
模型显示,随着时间的推移,所有家系的适应度上升,并被几个适应度更高的家系打断。
关于模型的预测能力,研究发现未来1-2个月的预测是可靠的。
PyR0模型的计算速度也值得称道。分析百万个基因组只需要1个小时!
它将相似的序列组合在一起,并通过它们共享的突变组来定义基因组的“组”。
PyR0有强大的统计能力!
最后,该模型可以确定哪些突变将变得越来越常见,并估计每个突变导致的病毒传播速度。
参考资料:
https://news.sciencenet.cn/htmlnews/2022/5/479928.shtm