导致全球猴痘流行的猴痘病毒基因测序取得新进展。在猴痘病毒第一个基因序列草案的基础上,葡萄牙国家卫生研究所的joo Paulo Gomes博士及其同事于当地时间5月23日继续在https://virological.org网站上公布了葡萄牙患者携带的另外9个猴痘病毒基因组序列。
到目前为止,全世界的科学家已经获得了13个猴痘病毒的最新基因测序结果,样本来自葡萄牙、德国、比利时和美国。总结这些结果后,科学家发现目前猴痘的爆发最有可能来自一个源头。尽管该病毒株与三年前在英国发现的病毒株密切相关,但与之相比,平均有50个SNPs突变。考虑到正痘病毒作为DNA病毒的突变率,突变程度超出了科学家的预期。
自5月份以来,世界上许多国家爆发了罕见和不寻常的猴痘疫情。世卫组织5月24日报告说,19个国家报告了131例确诊病例和106例疑似病例。在这次疫情爆发之前,猴痘病例主要分布在非洲中部和西部的热带雨林中。5月23日,世卫组织的主要顾问大卫·海曼(David David Heymann)表示,有分析认为,欧洲前两次锐舞派对中的大规模性行为是本轮猴痘蔓延的主要原因。
据约翰·保罗·戈麦斯(John Paul Gomez)介绍,最新公布的9项基因组序列检测结果来自于2022年5月15日和17日采集的9名葡萄牙患者的样本。该团队从患者的皮肤渗出液中采样病毒DNA,然后在Illumina平台上,通过高通量鸟枪法宏基因组测序对病毒基因组进行双端测序(2 × 150 bp)。测序深度从38次到508次不等(平均201次)。与第一个样品使用的纳米孔平台相比,平均覆盖深度约为7倍,测量精度有了很大提高。
团队将新测序的基因组整合到猴痘病毒基因进化树中,与美国公布的病毒基因组序列(MPXV_USA_2022_MA001)进行比对。据观察,这次多国爆发的猴痘可能只有一个来源,迄今为止发表的所有病毒基因序列都紧密聚集在一个分支中。
图1:葡萄牙约翰·保罗·戈麦斯团队绘制的猴痘病毒基因进化树。
研究小组表示,通过在病毒基因进化树上定位样本基因组序列,可以确认此轮疫情中的猴痘病毒属于一个较温和的西非分支,与2018年和2019年从尼日利亚出口到几个国家(英国、以色列和新加坡)的猴痘病毒关系最为密切。
然而,令人担忧的是,本次暴发的猴痘病毒基因组与2018-2019年的病毒基因组相比,平均存在50个单核苷酸多态性位点(SNPs,主要指基因组水平单核苷酸变异导致的DNA序列多态性。这是生物体中最常见的遗传变异之一。考虑到正痘病毒的预期替代率,这远远超出了人们的预期。
在此之前,英国爱丁堡大学的进化生物学家AndrewRambaut说,“我们估计,天花病毒(猴痘的一种相关病毒,属于正痘病毒)的基因组每年每个位点约有1x10-5个替换,导致平均每年1-2个核苷酸发生变化。这是估计的高端。”
此外,研究小组在爆发集群中发现了病毒基因微进化的第一个迹象,即出现了7个单核苷酸突变位点(SNPs),导致了3个后代分支(图1),其中一个分支涉及两个基因序列(PT0005和Pt008)的亚集群(由两个SNPs支持)。值得注意的是,两个序列还存在基因移码缺失。
“在猴痘流行的中非环境中观察到了基因丢失事件,并认为它与人与人之间的传播有关。”约翰·保罗·戈麦斯说。同时,他说,这种微进化的情况也表明,基因组测序可能会提供足够的分辨率来跟踪当前疫情中的病毒传播。
宿主APOBEC3编辑机制或病毒突变
至于最新猴痘病毒这种单核苷酸突变的原因,大多数科学家认为是宿主APOBEC3的蛋白质编辑机制所致。
戈麦斯分析道,“我们不能放弃猴痘病毒基因进化树的分叉是病毒宿主体内APOBEC3编辑机制导致的病毒进化跳跃(导致病毒高度突变)的假设。”
APOBEC3蛋白酶存在于人类和一些哺乳动物体内,能起到防御病毒的作用。主要抗病毒机制是在病毒单链DNA复制过程中,能使胞嘧啶碱基脱氨,变成尿嘧啶碱基。当另一条链被合成时,尿嘧啶碱基与腺嘌呤碱基配对,导致G→对病毒致命的高度突变。
此前,美国一个研究团队在5月18日公布了马萨诸塞州确诊的猴痘患者的基因测序数据后,Andrew Lambotte将美国样本(MA001)和葡萄牙首例样本(PT0001)与三年前,即2018年至2022年的英国样本(UK_P3)进行了对比。病毒基因组中单核苷酸多态性位点的差异有很大的趋势。除了两个例外,所有的G → A突变都显示GA → AA,所有的C → T突变都显示TC → TT,这似乎都是APOBEC3编辑模式偏好的单核苷酸突变。
图2:英国爱丁堡大学进化生物学家安德鲁·兰博特标记的猴痘病毒基因进化树。
兰博特认为,在大多数情况下,病毒的这种随机高突变会改变和破坏蛋白质的功能,使病毒失去活性。但有时候APOBEC3编辑机制不足以攻击病毒使其失活,病毒会继续复制传播。尽管导致2022年猴痘爆发的病毒株在进化树上具有异常长的分支,但根据该模型,可以预测所有或大部分突变可能发生在一轮复制中。
葡萄牙Gomez团队的新测序结果发表后,Lambotte评论道,“所有新的单核苷酸多态性位点都是二核苷酸环境中的TC→TT或GA→AA。这支持了大多数单核苷酸突变是宿主蛋白酶编辑的结果,而不是DNA聚合酶复制错误的产物。
不过戈麦斯也对APOBEC3的编辑机制提出了一些质疑。他认为,之前的研究结果表明,在APOBEC3的编辑机制下,小片段的C → T和G→A倾向性变异出现在基因组的局部区域,而不是像这里观察到的那样扩散到一个广泛的基因组区域——长度达到了150kb。另外,考虑到APOBEC3的作用机制,需要处于DNA的单链状态才能对其起作用。
“这令人费解。”他说。
对此,Lambotte推测,这可能是病毒基因组多次复制时,DNA的两条链都暴露了,使得APOBEC3蛋白酶作用于两条链上的碱基。
美国圣地亚哥J.Craig Venter研究所生物信息学博士Anna Maria Niewiadomska进一步解释了APOBEC3在不同宿主中的编辑机制。她说APOBEC3编辑非常依赖宿主物种。与啮齿类动物相比,人类拥有更多的APOBEC3蛋白酶库(A3A、A3B、A3C、A3D、A3F、A3G和A3H),而啮齿类动物(大部分)只有一个双结构域A3蛋白酶。不同的蛋白酶在不同的环境中倾向于突变C,并且可能具有不同的细胞定位。比如人A3G会在CCT优先突变CCC >: C,而小鼠A3在ty优先突变Tyc >: C。
兰博特回应称,“我不认为目前的病毒基因组数据可以让我们区分宿主,但最新的葡萄牙基因组序列显示,最新的病毒突变确实发生在人类身上,基因进化树上的黄点(图2)意味着突变也发生在非人类动物身上。"