摘要:

1、 新冠病毒具有高突变性、能够产生大量变异毒株的核心原因主要是遗传物质不稳定、宿主缺乏碱基错配校对机制和病毒的高复制速度。

2、 当前全球接受度最高的新冠病毒毒株分类体系是Pangolin(穿山甲)分类体系,通过字母加数字的方式为重要突变后代命名;数字越靠左,代表的子代级别越高;字母后的数字超过三位以后,会另辟新的字母替代。字母X用于基因重组谱系,如XBB毒株是由BA.2.75和BJ.1重组而来。

3、 美国疾控中心对新冠病毒毒株有完善的监控机制,一方面通过基因测序来理解毒株、进行分类,另一方面按照突变毒株的危害度从低到高分为监测毒株、关注毒株、重点关注毒株、高危毒株,并动态进行调整,为制定相关疫情防控政策提供依据。

 

大家好!2022年末这波疫情相信小伙伴们都有比较切身的体会。由于体质差异等原因,大家展现出来的重症程度、症状持续时间、症状类型都有显著的不同。在网络上交流时,大家倾向于把这种症状的差异归结于感染毒株的不同,甚至为新冠病毒的不同毒株取了大量名字,例如按症状分有“刀片株”、“瞌睡株”、“咳嗽株”、“腹泻株”等。那么按照国际权威病毒研究机构的体系,新冠病毒有哪些毒株?对毒株进行分类有什么实际作用?我们今天就来一起扒一扒新冠病毒的“族谱”。

 

新冠病毒高突变性原因

 

新冠病毒问世已有三年多,产生大量变异毒株的核心原因还是要从病毒自身的特性出发进行解释,主要可以归纳为三点:遗传物质不稳定、宿主缺乏碱基错配校对机制、高复制速度

 

遗传物质不稳定:新冠病毒的基因组是RNA,RNA作为遗传物质相较于DNA具有较强的不稳定性。一方面因为DNA是双螺旋结构,两条链上都有正确的遗传信息,即使一条链偶然复制出错,还有另一条链可以作为模板链进行校对修正。而RNA是单链结构,复制一旦出错突变就发生了,相对不稳定。另一方面RNA的组成单元核糖核苷酸2’端(化学上碳原子命名上,将五碳糖中离氧原子最近的一个碳原子,顺时针依次进行标号,如连接磷酸基团的就是5’端)上连接的是羟基(-OH),氢原子直接与氧原子连接,属于活泼氢,容易发生化学反应。而DNA的组成单元脱氧核糖核苷酸2’端氢原子直接连接在碳原子上,化学性质相对不活泼。

 


 

宿主缺乏碱基错配校对机制:人体细胞以DNA而非RNA作为遗传信息载体,DNA如果复制出错,人体的DNA聚合酶、DNA连接酶等能够通过复杂机制识别出不正确的链,对其进行切除,再重新合成正确配对的双链DNA。但对RNA复制就缺乏这种碱基配对错误的校对机制,导致更高的RNA突变率

 

高复制速度:在碱基配对原则的制约下,RNA复制虽然相对DNA不稳定,发生错误仍然是小概率事件,因此需要极大的样本量才可能发生。根据香港大学医学院微生物学系的一项研究显示,细胞在受感染的48小时以内,新冠病毒的数量最多可复制100倍,而“非典”病毒最多只复制10-20倍,整体而言,新冠病毒复制能力较“非典”病毒强约3.2倍。正是新冠病毒的高复制速度,加上超强的人间传染能力,才提供了RNA病毒变异的大样本基础,新毒株不断出现。

 

新冠病毒毒株分类体系

 

Pangolin分类体系

 

新冠病毒爆发三年以来,在英国、南非、印度、巴西等地不断发现新的变种,学界一直在寻找一种统一的方法对这些变种毒株进行命名和分类。目前最科学、接受度最高的基因分型方法为Pangolin分类体系,全称是Phylogenetic Assignment of Named Global Outbreak Lineages,即根据系统发育关系来对全球所有新冠病毒突变毒株进行家系的分配和标记。Pangolin刚好是穿山甲的英文名,新冠病毒刚爆发时,一度有传言认为穿山甲是中间宿主之一,但后续并未被证实。通过Pangolin家系分型,可以快速对新发序列进行定位和溯源。

 

为更好地理解Pangolin分类体系的命名思路,我们首先需要了解新冠病毒的两种变异方式。一种是基因突变,另一种是基因重组。基因突变的原理是RNA复制过程中产生错误,形成单碱基或多碱基突变,大多数突变对于病毒自身而言是致命的,少数突变能够让病毒的生存能力和传染能力等显著增强;基因重组主要在不同亚种的病毒之间发生。当同一宿主感染不同亚种病毒以后,两种病毒都需要用宿主细胞的核糖体等复制系统来自我复制,由于来自同一亚种,基因片段非常相似,宿主细胞复制系统有时会弄混,生成两个病毒亚种的“杂交”后代。

 

1.基因突变毒株

 

Pangolin分类体系通过字母加数字的方式给新冠病毒较为重要的突变的血系进行后代命名。该分类体系可以进行动态调整,学者可以根据划分分支的依据自行划分并提交某一分支。在2020年3月3日中国科学院主办的《国家科学评论》(National Science Review)发表的论文《关于SARS-CoV-2的起源与持续进化》中,新冠病毒最初的两个亚型即为S型和L型,分别对应Pangolin分类体系中的A和B。该论文同样揭示“从占比上看,L亚型更为普遍,达到70%,S亚型占30%”,因此三年后的我们看到更大比例的突变毒株都以B开头。

 

Pangolin分类体系下,字母后的数字越靠左,代表的子代级别越高。例如B型最早在意大利爆发的突变株,Pangolin分类体系将其命名为B.1。而2021年肆虐全球的德尔塔毒株Pangolin体系命名为B.1.617.2,即德尔塔是B.1毒株的第167个子代的第2个子代。也许有小伙伴疑问,那为什么不把德尔塔命名为B.1.618呢?这是因为从系统发育理论的视角看,B.1.167其实有两个相似度很高的变异株。最初卡帕(Kappa)毒株是B.1.167,后德尔塔大流行后,学者发现卡帕和德尔塔的变异点位非常相似,但在最终病毒的性状表现上还是有显著差异,因此分别命名为B.1.167.1(卡帕)和B.1.167.2(德尔塔)。

 

Pangolin分类体系下,字母后的数字超过3个以后,会用其他字母进行替代。例如B.1.1.1.1就命名为C.1,B.1.1.7.1就命名为Q.1。在英国最早发现的第一个显著突变毒株阿尔法(alpha)是B.1.1.7,因此阿尔法毒株的子代就是Q.N。在二十六个字母用完以后就会开始使用AA、AB的双字母组合,在双字母组合用尽后会启用三字母组合,以此类推,有点儿像Excel表的列名。例如去年12月份盛行于两广地区的“南方株”是BA.5.2实际上是奥密克戎(Omicron)B.1.1.529的后代,而同期盛行于北京地区的“北方株”BF.7实际上可以写作BA.5.2.1.7,通过Pangolin分类体系的命名,我们可以知道“北方株”是“南方株”后代变异

 

2.基因重组毒株

 

Pangolin分类体系下,字母X用于重组谱系。例如XA是由阿尔法病毒(B.1.1.7)和另一种毒株B.1.177重组而来,2022年底开始进入我国的XBB毒株则是由BA.2.75和BJ.1重组而来。

 

WHO(世界卫生组织)分类体系

 

如果说Pangolin分类体系是最科学、最详细、接受度最高的分类体系,那么WHO分类体系可能是当前最常见、最简单、最有人文精神的。2021年5月31日,WHO宣布将改用希腊字母命名变异后的新冠病毒毒株,以避免对最早发现变异病毒的国家污名化。未来在24个希腊字母用尽以后,如果还有新的变异毒株出现,可能会采用星座对其命名。

 

毒株监测分类体系

 

美国卫生和公共服务部(U.S. Department of Health and Human Services, HHS)设立了新冠病毒跨部门工作小组(SARS-COV-2 Interagency Group, SIG)用于强化美国疾控中心(Center for Disease Control and Prevention, CDC)、国家卫生署(National Institute of Health, NIH)、美国食品和药物监督局(Food and Drug Administration, FDA)等部门的工作。SIG主要的职能是对新毒株的跟踪分类,并研究其对新冠病毒相关疫苗、治疗手段、诊断等的影响。SIG将新冠病毒突变毒株(Variant)被分为四类,由关注度从低到高排列如下:

  监测毒株(Variants Being Monitored, VBM):对公众健康没有产生广泛威胁;在美国本土流传率很低。

  关注毒株(Variants of Interest, VOI):对病毒的传播速度、感染后的重症程度、病毒检测、治疗和疫苗研发存在潜在影响的变异;由该毒株引起的病例短时间显著上升。

  重点关注毒株(Variants of Concern, VOC):对病毒的传播速度、感染后的重症程度、病毒检测、治疗和疫苗研发存在实质影响、且有实质证据的变异。

  高危毒株(Variants of High Consequence, VOHC):病毒的传播速度、重症程度显著提升,原有病毒检测、治疗、预防手段效用显著降低。

 

WHO的毒株分类只有VOC和VOI,并且把VOC和VOI统称为VBM。美国疾控中心的分类体系相对界限更明晰。对毒株的分类是可以动态调整的,例如德尔塔(delta)毒株在2021年6月15日被列入VOC名单,在2022年4月14日,德尔塔被降级至VBM序列。降级原因包括:(1)全国和区域内由该毒株引致的感染持续大幅下降;(2)对国民健康不存在显著威胁

 

WHO命名的主流毒株、对应的Pangolin体系命名及毒株监测分类变化情况如下表:

 

 

美国疾控中心“基因监测”机制

 

上述毒株分类体系的核心目的还是为了对新冠病毒的变异进行及时监测及跟踪,这样一旦高危毒株出现时可以尽早制定应对方案,防止大规模公共健康事件发生。而为了形成和持续维护这种毒株分类体系,美国疾控中心制定了一整套“基因监测”(Genomic Surveillance)机制,名为国家新冠病毒毒株监测项目或NS3项目(National SARS-CoV-2 Strain Surveillance System, NS3)。在该项目下,美国疾控中心和州立、地方、私人医疗卫生机构形成密切合作,每周可以从这些管道调取多达750份病毒样本进行检测分析。

 

对新冠病毒的毒株进行基因测序(Genomic Sequencing)是理解毒株、进行分类的基础,步骤如下:

  样本接收及初步处理:收取从不同管线调取的毒株样本,在实验室信息系统中进行登记;

  样本预处理及测序:从样本中提取新冠病毒RNA,以该RNA单链为模板,在反转录酶的作用下,按照碱基配对原则合成一条与RNA模板互补的DNA单链,称为互补DNA(Complementary DNA, cDNA),形成RNA-DNA杂交体。随后在反转录酶的作用下,RNA链水解,以cDNA链为模板根据碱基配对原则合成第二条DNA链,形成完整的双螺旋DNA。之后将该DNA载入“下一代基因测序设备”(Next-Generation Sequencing Equipment)。

  基因序列数据生成及搜集:通过对设备返回的原始数据进行处理,得到病毒样本的碱基对序列。该序列数据需要进一步和部分私营实验室的序列数据进行比对校验。

  基因序列数据的申报及存储:在经过多轮质控复核流程后,正确的基因序列数据被上传到公共卫生数据库,包括国家生物科技信息中心(National Center for Biotechnology Information, NCBI)和全球流感数据共享组织(Global Initiative on Sharing Avian Influenza Data, GISAID),供全球流行病学学者研究使用。

 

 

相信通过本文的阅读,大家对新冠病毒毒株的常见种类、分类体系、分类原理都有了更深刻的理解。新冠疫情以来,公共卫生体系建设与人民健康保障已经上升到国家战略角度,公卫健康指数成分股覆盖了“前端预防、研发”、“中端诊断、数据统计监测”和“后端治疗”中的龙头企业,在“乙类乙管”政策新阶段,或将持续有亮眼表现,欢迎大家持续关注跟踪国证公卫健康指数(980016.CNI,编制机构:国证指数公司)的泰康公卫健康ETF(159760)

 $泰康公卫健康ETF(SZ159760)$

乘风破浪会有时,“指”挂云帆济沧海。生命因不同而精彩,投资因独立而出众。关注指数投资,找到属于自己的长期。

 

风险提示:本材料仅作宣传所用,不作为任何法律文件。文中观点仅供参考,不代表任何投资建议,投资者不应以该等信息取代其独立判断或仅根据该等信息做出决策。投资有风险,基金管理人管理的其他基金的业绩不构成对本基金业绩表现的保证。投资泰康公卫健康ETF可能遇到的特有风险包括:(1)标的指数回报与股票市场平均回报偏离的风险;(2)标的指数波动的风险;(3)基金投资组合回报与标的指数回报偏离的风险;(4)标的指数变更的风险;(5)指数编制机构停止服务的风险;(6)成份券停牌的风险;(7)基金份额二级市场交易价格折溢价的风险;(8)IOPV计算错误的风险;(9)申购赎回清单差错风险;(10)退市风险;(11)沪市成份证券申赎处理规则带来的风险;(12)投资者申购失败的风险;(13)投资者赎回失败的风险;(14)基金份额赎回对价的变现风险;(15)基金在二级市场的流动性风险;(16)第三方机构服务的风险;(17)因终止上市导致终止基金合同并进行基金财产清算的风险等。基金管理人承诺以诚实信用、勤勉尽责的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。基金有风险,投资需谨慎。投资者购买基金时应认真阅读《基金合同》、《招募说明书》、《产品资料概要》等基金法律文件(详阅官网网页www.tkfunds.com.cn或客服热线400-18-95522),在投资金融产品或金融服务过程中应当注意核对自己的风险识别和风险承受能力,选择与自己风险识别能力和风险承受能力相匹配的金融产品或金融服务,并独立承担投资风险。

追加内容

本文作者可以追加内容哦 !