前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Nature | 基因密码中的远古回响:东南亚人群基因组揭示人类演化新篇章

Nature | 基因密码中的远古回响:东南亚人群基因组揭示人类演化新篇章

原创
作者头像
阔跃生物
发布于 2025-05-16 09:32:57
发布于 2025-05-16 09:32:57
1700
举报

东南亚大陆(Mainland Southeast Asia, MSEA)以其丰富的民族和文化多样性著称,拥有近3亿人口。然而,当前的人类基因组数据库中,MSEA人群的代表性严重不足。

近日,中国科学院昆明动物研究所联合东南亚多国科研机构在东南亚人群基因组研究领域取得里程碑式突破。其研究Genome diversity and signatures of naturalselection in mainland Southeast Asia发表在国际知名学术期刊Nature 上。该研究通过深度短读长全基因组测序(WGS)对来自30个MSEA族群的3,023个个体进行了分析,并结合长读长测序对37个代表性个体进行了高精度组装,构建了SEA3K基因组数据集(第一阶段)。研究发现了大量新颖的基因组变异,揭示了MSEA人群的高度遗传异质性,并鉴定了与自然选择和古人类基因渗入相关的基因组区域。

基因组变异的发现与特征

研究共鉴定出79.59百万个小变异(包括65.35百万个单核苷酸变异(SNVs)和14.24百万个短插入缺失(indels)),其中22.83百万个变异为首次报道(图1b)。这些新变异中,98.77%为低频变异(等位基因频率AF ≤ 0.01),1.23%为常见变异(AF > 0.01)(图1c)。每个个体平均携带4.85百万个变异,略高于欧亚人群(图1d)。

图1:SEA3K基因组变异的统计结果
图1:SEA3K基因组变异的统计结果

此外,通过长读长测序,研究还鉴定了96,384个结构变异(SVs),包括38,531个缺失、55,073个插入、134个重复、920个倒位和1,726个复杂SVs(图2d)。其中24,622个SVs(26.3%)为首次发现(图2i),这些SVs的功能注释显示,20.8%位于调控区域,1.0%位于编码区(图2h)。

图2:基于37名MSEA个体长读长基因组数据的SV检测
图2:基于37名MSEA个体长读长基因组数据的SV检测

群体遗传结构与历史

主成分分析(PCA)显示,MSEA人群与东亚人群具有遗传亲和性,且其遗传分化与地理距离高度一致(Procrustes相似性统计量t0=0.548t0=0.548,P=1.2×10−6P=1.2×10−6)(图3a)。群体聚类分析进一步揭示了MSEA人群的复杂遗传结构,其语言家族与遗传聚类不完全对应,暗示了历史上的基因交流和语言转换(图3b)。连锁不平衡(LD)衰减模式显示,MSEA人群的LD谱具有广泛多样性,反映了其多样化的群体历史和遗传结构(图3c)。通过MSMC2和SMC++方法推断的群体动态表明,MSEA人群在15-20万年前共享了与东亚人群相似的群体历史,并在末次冰期经历了持续的瓶颈效应(有效群体大小NeNe约为1,000)(图3e)。

图3:MSEA人群的遗传结构与群体历史
图3:MSEA人群的遗传结构与群体历史

自然选择的基因组信号

研究通过复合多信号评分(CMS)鉴定了44个具有强烈达尔文正向选择信号的基因组区域,覆盖89个基因(图4a)。这些基因主要涉及体型特征(如身高)、免疫反应、代谢、神经系统和心血管系统等功能。其中,最显著的选择信号位于1号染色体的FLG基因区域(chr. 1:152033580-152476512),包含262个MSEA富集的SNVs,涉及皮肤屏障功能和毛发形态发生相关基因(图4b)。此外,研究还发现了一个MSEA特异性富集的7,439 bp缺失(位于PEX14基因内含子区),其等位基因频率在MSEA人群中为14%,而在其他人群中罕见或缺失(图4e)。功能注释表明,该缺失位于开放染色质区域,可能影响邻近基因的调控活性(图4f)。

图4:MSEA群体基因组中的正向选择信号
图4:MSEA群体基因组中的正向选择信号

古人类基因渗入模式

通过Sprime和IBDmix分析,研究发现MSEA人群平均携带62.82 Mb的古人类序列(尼安德特人和丹尼索瓦人)。与全球人群相比,MSEA人群的尼安德特人序列含量介于东亚和南亚人群之间,而丹尼索瓦人序列含量与东亚人群相近(图5a)。值得注意的是,丹尼索瓦人基因渗入在MSEA人群中表现出多样化模式:13个群体显示单次渗入信号,而其他群体(如越南的VIKI和老挝的LALT)显示至少两次 distinct 渗入事件(图5b)。此外,研究还鉴定出5个尼安德特人和2个丹尼索瓦人渗入区域,这些区域包含与代谢、免疫和肌肉发育相关的基因(图5c)。例如,11号染色体上的一个尼安德特人渗入区域(含ARHGEF12和TLCD5基因)在MSEA人群中富集(平均18.6%),而在其他人群中罕见(图5d)。

图5:MSEA群体基因组中的正向选择信号
图5:MSEA群体基因组中的正向选择信号

结论与展望

该研究通过大规模基因组测序,填补了MSEA人群在基因组数据库中的空白,揭示了其丰富的遗传多样性和复杂的进化历史。研究结果表明,MSEA人群的基因组特征受到地理隔离、区域混合、古人类渗入和自然选择等多种进化力量的塑造。未来研究需进一步验证这些选择信号的功能和表型关联,并探索其在精准医学中的应用潜力。SEA3K数据集为理解东南亚人群的史前历史、遗传适应和复杂疾病提供了重要基础。

关注我们,获取更多前沿生物信息学研究成果!有什么想法可以在评论区评论,也可以私信获取原文PDF哦!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档