关键词:血型系统;生信分析;变异检测;
提维岛民由于遗传隔离形成了独特的血型抗原分布特征,与澳大利亚主要献血群体(高加索人种)存在显著差异,在输血过程中容易引发同种免疫反应。面临着因血型抗原多态性导致的输血风险。
为此,研究团队为解决这一问题,首次采用基于全基因组测序的RBCeq算法,对457例提维岛民样本进行了系统性血型分析。通过1000基因组计划第三阶段(1KGP3)与数据比对,结合主成分分析、群体遗传结构解析系统描绘了该群体的血型基因组特征。在数据分析过程中,使用Sentieon DNAseq进行了变异检测。
研究发现提维人群具有显著的血型特异性:O型血比例高达81.18%,A2亚型极罕见,存在独特的RHD变异(如DIII type4频率1.75%),同时观察到Do(a+b-)表型高发和Fy(a-b+)表型低发。
今天的文献解读专栏给大家带来的是2022年发表在TRANSFUSION期刊的:“ The genomic landscape of blood groups in Indigenous Australians in remote communities”。
样本来源
提维样本457例,其中189例进行全基因组测序,268例进行基因分型;
千人基因组计划第三阶段的2504例;
变异检测和注释
使用GATK和Sentieon DNASeq (V201808.08)进行变异检测,以GRCh37作为参考基因组。经过质量过滤,获得39个与hg38比对后存在变异的vcf文件,为进行血型等位基因注释,将变异转换为GRCh37版本。
Sentieon DNAseq通过优化核心算法,显著提升了分析效率:FASTQ到vcf文件的分析流程约提速10倍,BAM到vcf文件的分析流程约提速20倍。且与开源软件的结果一致性达到99.7%以上。此外,还支持多倍体和大型基因组分析。Sentieon能够满足您不同规模的研究需求,帮助您更快速、准确地获取分析结果。
使用RBCeq预测血型抗原特征,以基因组变异调用格式(gvcf)为输入,通过BAMTrimmer计算血型基因覆盖度。用RBCeq来分析45个基因的SNV、indels和CNV,用于描述36个血型和两个转录因子。
RBCeq扫描vcf文件中的参考和替代等位基因,根据合子性指导亚等位基因选择,并对配对的等位基因进行评分。输出包括ISBT血型抗原等位基因和表型预测,以及未映射到ISBT等位基因的高质量有害变异分类。使用BedTools(bin大小:1)对RH基因覆盖度进行标准化分析。
使用PLINK v1.9对42个常染色体血型编码基因的695个变异进行主成分分析。使用ggplot2绘制PCA结果,采用ANNOVAR进行变异注释,并使用R库(circlize、ComplexHeatmap等)进行数据可视化。
主成分分析显示提维人群具有独特的血型基因组特征,与澳大利亚主要献血者群体(欧洲人群)的相关性较低。提维人、非洲人和东亚人之间存在明显差异,但这三个群体都与其他全球人群有显著的区别。
在血型分布方面,提维人群展现出独特的模式。O型血在该人群中占比高达81.18%,远高于白种人的44%、非洲人的49%和亚洲人的43%比例。A型血主要以A1型为主,A2型仅占0.22%,这是首次在原住民人群中报告A2亚型的流行率。
在稀有血型方面,Jk(a+w b)在提维人群中的频率为16.19%,与东亚人的16.47%相近,而显著高于其他人群。DIII type 4的纯合频率为1.75%,这种部分D表型若被误判可能会导致输血风险。提维人群Do(a+b)的流行率为50.32%,是其他全球人群的两倍以上,而Do(ab+)的比例不到其他人群的一半。还发现提维人群中Fy(ab+)的流行率较低。
将提维人群的RHD/RHCE血型预测表型频率与1KGP3数据集和先前报告进行比较。发现在151个提维全基因组测序样本中RHD基因纯合的流行率达100%,高于其他所有人群。D+Cc+E+e+表型在提维和东亚人群中的比例较低,而D+C+c+Ee+表型的流行率是大多数人群的两倍(除美洲和非洲人群)。
新变异研究发现了13个具有临床关联的变异,其中5个在提维人群中频率较其他人群高出两倍。同时检测到28个罕见变异(频率≤0.05),以及13个具有致病性的新变异。这些发现为提维人群的血型遗传特征提供了全面的认识,对指导临床输血实践具有重要意义。
与其他原住民人群相比,提维人群在某些血型系统上表现出独特性。提维数据集中10%的样本缺乏KN血型系统的高频Yk(a+)抗原,低于西部沙漠人群的38%。Diego血型系统仅检测到参考抗原,K+k在提维人群中完全缺失。MNS血型系统的Mc+抗原在提维人群中以杂合形式存在。这些特征进一步证实了提维人群在血型遗传方面的独特性。
Sentieon 软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。截至 2023 年 3 月份,Sentieon 已经在全球范围内为 1300+用户提供服务,被世界一级影响因子刊物如 NEJM、Cell、Nature 等广泛引用,引用次数超过 700 篇。此外,Sentieon 连续数年摘得了 Precision FDA、Dream Challenges 等多个权威评比的桂冠,在业内获得广泛认可。
研究背景与人群特征
本研究首次对提维原住民进行全面血型研究,将其血型基因特征与1KGP3数据集中的非洲、美洲、亚洲和欧洲人群进行比较。人群分层分析显示提维参与者具有独特的遗传构成,这与非洲参与者的情况相似。
血型系统分布特征
在ABO血型系统中,A2亚型主要存在于欧洲和非洲人群。Lutheran血型系统中的Au(ab+)表型在所有六个人群中都有发现,但频率各异。弱Jk(a+wb)表型在东亚和提维参与者中的流行率最高。
RH血型系统特点
RHD基因纯合(D+表型)在提维人群中达到100%,其他人群也呈现较高比例。研究发现八个提维个体携带纯合的DIII type4,该类型容易被误判为D+,可能增加同种抗-D产生的风险。
新变异发现
通过二次分析,研究发现13个具有致病性临床关联的变异。同时检测到29个罕见变异,其中11个在提维人群中的频率明显升高。使用生物信息学预测技术还识别出13个潜在的新变异。
研究的发现对于识别供者和血型配型具有重要意义,特别是发现东亚人群的血型特征与提维人群最为接近。这些数据将有助于制定针对提维人群和其他澳大利亚原住民社区的输血安全计划。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。