美国麻省理工学院的科学家在11日出版的《自然·通讯》杂志撰文称,在进行了广泛的比较基因组学研究之后,他们绘制出了新冠病毒迄今最精确完整的基因注释图谱,确认了几种蛋白质编码基因,也发现有些基因并不编码任何蛋白质。此外,他们还分析了新冠病毒不同毒株产生的近2000个突变,从而能更好地评估这些突变的重要性。
新冠病毒的基因组由近30000个RNA碱基组成。此前科学家已经根据与相关病毒中蛋白质编码基因的相似性,确定了一些能编码蛋白质的基因。他们认为,另外还有些基因能编码蛋白质,但它们并没有明确归类为蛋白质编码基因。
为确定这些蛋白质编码基因,计算机科学和人工智能实验室的玛诺里斯·克里斯教授领导的实验团队利用自己开发出的计算技术,对新冠病毒、萨斯病毒和42株蝙蝠沙贝病毒亚属进行了分析。这一技术的基本原理是分析物种之间是否保存着某些DNA或RNA碱基,并比较它们随时间如何进化,他们此前已利用该技术比较了人类基因组与其它哺乳动物的基因组。
结果表明,除发现此前已在其他冠状病毒中发现的5个基因外,克里斯团队还确认了新冠病毒基因组中6个蛋白质编码基因,而其他5个被认为能编码蛋白的基因并无此能力。他们表示,在分析了整个基因组后,非常确信没有其他蛋白质编码基因成为“漏网之鱼”。他们计划继续开展实验研究,以弄清这些没有特征的基因的功能。
此外,克里斯团队还分析了自新冠病毒首次被发现以来,已经出现的1800多个突变,并比较了每个基因在过去的进化速度和疫情暴发以来的进化速度。结果表明,大多数情况下,在疫情暴发之前长时间快速进化的基因仍在继续快速进化,而缓慢进化的基因也保持着自身的节奏。不过也有例外,这可能有助于揭示病毒在适应新的人类宿主时是如何进化的。
研究人员还分析了几种新冠病毒变异毒株——B.1.1.7、P.1和B.1.351等出现的突变。结果发现,许多使这些变异更危险的突变存在于刺突蛋白中,有助于病毒更快地传播并避开免疫系统。他们指出,每个变异毒株都拥有20多个独特的突变,知道哪些可能有用,哪些无用非常重要,有助于科学家专注最有可能对病毒传染性产生重大影响的突变。
总编辑圈点
病毒是什么?新冠病毒又有何特殊?早在1977年,生物学家就告诉我们病毒“只是包裹在蛋白质中的一条遗传信息”,病毒必须感染进入活细胞才能进行复制和传播。因此,当新冠病毒找到合适的细胞时,它也会注入一条包含整个基因组的RNA链,科学家对其基因图谱的分析,提供了一条了解新冠病毒蛋白的途径。但这其中,有的蛋白质功能未知,有的蛋白质可能无用,此次的研究成果就是在完善人们的认知,其有利于改善诊断技术、开发新的治疗药物,同时,也使我们推断出这场疫情里更多特征,实时跟踪其传播和变异。(记者刘霞)
原标题:新冠病毒精确完整基因注释图谱完成