$华大基因(SZ300676)$  

全基因组测序技术可发现人类血液中所含有的各类已知的或尚未明确的病毒序列,可为病毒感染预防、疫苗开发和病毒基因组、流行病学等研究提供重要数据基础。


10月,上海交通大学医学院附属瑞金医院,上海交通大学转化医学研究院联合华大,基于华大自主DNBSEQ测序平台,对来自中国代谢解析计划(ChinaMAP)的10,585人全基因组测序数据中的非人源基因序列进行了深入分析,构建了首个中国人群血液病毒组学图谱,分析了 14 种病毒的人群携带率、病毒丰度和地理分布,为疾病预防与流行病学研究提供了参考,相关研究成果发表于Cell Discovery期刊。

此项研究通过提取10,585人WGS数据中的非人源基因序列进行研究,建立了基于WGS分析病毒序列的方法,并发现了14种广泛存在于中国人群中的病毒,如指环病毒、乙型疱疹病毒、人内源性逆转录病毒、人腺病毒C和乙型肝炎病毒等。

检出率最高的是指环病毒(Anellovirus),在76.7%的个体中发现了包括TTV(Torque teno virus)和TLMV(TTV-like mini virus)等在内的指环病毒基因序列;在30.3%的个体中检测到HHV-4(Human gammaherpesvirus 4, EBV),高于欧洲人群队列的报道(14%)。


乙型疱疹病毒(Betaherpesvirus)也被广泛检出,其中,HHV7(Human herpesvirus 7)、 HHV6A(Human betaherpesvirus 6A)、HHV6B(human betaherpesvirus 6B)和HHV5(Human betaherpesvirus 5, HCMV)分别在13.2%、0.36%、1.09%和1.03%个体中发现。


人内源性逆转录病毒(Human endogenous retrovirus K, HERV-K)、人腺病毒C(Human mastadenovirus C )和乙型肝炎病毒(Hepatitis B virus, HBV)分别在 8.20%、2.41%和1.69%的个体中被发现。


此外,研究团队在50个个体(0.47%)中检出了HPV序列,涉及的亚型有Gammapapillomavirus 1、Betapapillomavirus 1和Alphapapillomavirus 4。

最受关注病毒——乙肝病毒

乙肝是我国重大传染性疾病,目前仍是肝癌发生的主要原因之一。研究团队在1.69%的个体中(n=179)检测到乙肝病毒(HBV)序列,主要由HBV-B(n=79)和HBV-C(n=59)两种亚型构成(占比77%)。进一步,研究团队对人类基因组中的病毒整合事件进行了分析,在10个样品中发现了HBV-B病毒序列整合,在18个样品中发现了HBV-C 病毒序列整合,这一结果表明:整合事件与病毒序列更高丰度显著相关,且HBV病毒序列在人基因组上的整合位点没有明显的富集区域。

图左:乙肝病毒在人基因组上的整合位点;图右:乙肝病毒基因组整合位点

病毒感染与遗传变异的相关性分析

研究团队通过全基因组关联研究(GWAS),对病毒感染与遗传变异是否存在相关性展开了进一步探讨。研究结果表明:ACR基因中的错义突变(rs79314756)(c. 71C>T, p. Thr24Met)与HHV6病毒携带显著相关 (P=3.21 10-15),该基因位点富集于东亚人群(gnomAD 频率0.000651,gnomAD EAS频率0.0164,ChinaMAP频率0.02971)。

HHV6属于betaherpesviruses,包括了HHV6A和HHV6B两种基因组序列一致性高达90%的病毒[1]。尽管HHV6感染对大多数人无害,但是也有研究发现HHV6感染与多发性硬化、阿尔茨海默病等神经系统疾病相关[2,3],说明了HHV6感染的潜在危害性不容忽视。这为未来HHV6病毒的传播机制研究,以及HHV6感染高风险区域人群的遗传风险评估提供重要的数据基础。

HHV6感染的全基因组关联分析(曼哈顿图)

综上,该研究利用基于华大自主DNBSEQ测序平台的高深度WGS数据,系统性研究了大规模人群中血液病毒组的情况,分析了14种病毒的人群携带率、病毒丰度和地理分布。

研究发现:在30%的个体中检出的EBV是人群携带频率最高的致病病毒、血液中HBV病毒丰度与整合事件相关、ACR的错义突变rs79314756与HHV6病毒携带显著相关等。这些发现将为疾病预防与流行病学研究提供重要信息。与此同时,也为更多的大人群基因组项目的开展提供了参考和借鉴。

本项研究基于中国代谢解析计划(ChinaMAP),由上海交通大学附属瑞金医院与华大基因合作完成,上海交通大学曹亚南/王卫庆/李林为通讯作者,华大基因郭佳/黄宣霖/张晨茜为第一作者。该研究得到了国家重点研发计划项目(2020YFA0112800、2020YFA0112801)、国家自然科学基金项目(82270842)、中国科学院医学科学创新基金项目(2020-12M-5-002)的资助。

研究得到了国家代谢性疾病临床医学研究中心(上海)、转化医学国家重大科技基础设施(上海)和医学基因组学国家重点实验室以及上海交通大学—华大联合创新研究中心的支持。该研究中的测序数据使用华大自主DNBSEQ测序平台完成。

追加内容

本文作者可以追加内容哦 !