首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >NAR|AI革新基因组学: AutoHiC助力染色体级别基因组组装

NAR|AI革新基因组学: AutoHiC助力染色体级别基因组组装

作者头像
数据科学工厂
发布2024-12-30 09:57:07
发布2024-12-30 09:57:07
8150
举报

目前染色质构象捕获(Hi-C)技术为染色体水平的组装提供了便利,但挂载过程仍然面临着很大的挑战。这是因为当用Hi-C技术挂载染色体时,挂载工具往往存在一定的缺陷,挂载结果需要手动修正。因此,实现自动纠正挂载错误和染色体划分,对于基因组组装具有重要意义。

近日,西南大学前沿交叉学科研究院生物学研究中心王翊教授研究组在基因组组装研究中取得了进一步进展。相关研究成果于2024年9月17日以 A deep learning-based method enables the automatic and accurate assembly of chromosome-level genomes 为题发表在 Nucleic Acids Research 上。该研究提出了AutoHiC,一种基于深度学习的方法,旨在自动检测和纠正基因组挂载中的错误,极大提高了基因组组装的连续性和准确性。AutoHiC利用Hi-C数据,通过全自动化的工作流程和迭代错误纠正机制,显著提升了基因组组装的质量和效率,为基因组挂载提供了创新的解决方案。

在该研究中,作者展示了一种名为 AutoHiC 的创新深度学习方法,专门用于识别和纠正基因组挂载过程中的错误拼接片段。它分为三个阶段:首先生成初步挂载结果;然后,通过错误检测与纠正模块提升挂载质量,包括纠正translocation,inversion错误和染色体划分;最后,生成可视化报告,展示纠正前后的基因组,帮助用户评估基因组质量。AutoHiC 的运行流程是完全自动化的,无论是错误纠正还是染色体划分,都无需人工干预,仅需提供基因组和 Hi-C 数据即可。

作者利用了来自NCBIDNA Zoo数据库中约300个物种的Hi-C数据对AutoHiC模型进行了训练。随后对模型进行了测试,验证了其在挂载错误检测和染色体划分方面的性能。通过混淆矩阵和精确率-召回率曲线分析,发现模型在translocation和debris的预测上准确率超过 90%,inversion预测准确率达到 85%,显示了模型的高可靠性。并在真实数据集上进行了验证,结果显示AutoHiC能够很好的纠正translocation与inversion错误,并对染色体进行准确的划分。

作者将AutoHiC与3D-DNA、SALSA2、YaHS和Pin_hic等工具进行了对比测试,AutoHiC在提升基因组连续性方面表现出色,AutoHiC证明了其在自动化错误检测方面的突破,为基因组学研究提供了准确的组装结果。还对人类基因组进行了AutoHiC校正,并与T2T参考基因组比较,以评估其对提高基因组准确性和连续性的效果。分析显示,AutoHiC显著提升了基因组连续性,减少了结构变异。Dot 图和共线性分析进一步证实了AutoHiC纠正后基因组与T2T参考基因组的一致性更高。为验证AutoHiC的效果,作者用AutoHiC处理了包括大型基因组、多染色体物种、多倍体植物和长读序列基因组在内的多种复杂基因组。通过N50、L50和CC率的计算,发现AutoHiC能显著提高基因组连续性。比较纠正前后的Hi-C热图,能够清晰地看到挂载错误和冗余序列被有效去除。这些发现证实了AutoHiC在提升基因组组装质量和适用性方面的显著优势。

这项研究在基因组挂载自动化错误检测与纠正方面取得了一定的进展,希望能为未来的基因组学研究和应用提供一个新的方向。虽然AutoHiC在基因组组装方面表现出了潜力,但它也存在一些限制。特别是在处理那些含有大量重复区域、高杂合度的复杂基因组,或是面对质量不高的Hi-C测序数据时,AutoHiC可能需要经过多次迭代来逐步修正错误。期待随着高质量Hi-C数据集的不断涌现,AutoHiC能够在用户手中发挥更大的作用,获得更高质量的染色体水平基因组。

  • 原文连接:https://doi.org/10.1093/nar/gkae789

西南大学前沿交叉学科研究院生物学研究中心,硕士研究生姜自杰为论文第一作者,王翊教授为通讯作者。西南大学为该研究论文第一完成单位和通讯作者单位。该研究受到国家自然科学基金(U21A20248)和重庆市科技创新重点研发计划(XDJK2019TJ003)和中国烟草研究项目(110202201003)资助。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-09-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 冷冻工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档