前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >snpQT-又一个人基因组SNP填充和GWAS流程

snpQT-又一个人基因组SNP填充和GWAS流程

作者头像
用户1075469
发布2021-11-02 15:26:33
6490
发布2021-11-02 15:26:33
举报
文章被收录于专栏:科技记者

发现搜索引擎是个神奇的东西,偶然想起的关键词一搜索,获得的就是意想不到的结果,我以imputation+qc搜索,就找到了snpQT(发音Snip Cute)这样一个神奇的工具/流程。这个流程的目的是让你的SNP cute,为处理人类基因变异提供了帮助:

  • 基因组版本转换(b37->b38或者反过来)
  • 样本质控
  • 人群分层
  • 填充前质控
  • 本地填充
  • 填充后质控
  • GWAS 使用自动化的nextflow流程,我们在Singularity容器或 Anaconda 环境中运行一系列版本的生物信息学软件,以提高可靠性和可重复性。

snpQT的目标用户:

如是你有如下的想法,它也许是有用的:

  • 使用可重复、快速和全面的流程获得一个干净的基因组数据集
  • 对识别某个特征的重要 Snp 关联有兴趣
  • 想要根据祖源识别和删除离群值
  • 想要本地填充
  • 您希望准备您的基因组数据集,以便在外部服务器中进行引种(遵循全面的 QC 和填充前 QC 准备)

你需要怎样开始

  • 已经获得snp,基于b37/38
  • 变异为vcf/plink格式
  • 变异有rs号
  • 样本有二分类/数量性状 如果你符合以上几点,看看文档吧:https://snpqt.readthedocs.io/en/latest/snpQT可能对你没用,如果你想:
  • 原始序列质控
  • call变异
  • 家系GWAS
  • 非人基因组数据

引用:

好像并没有发表在好的杂志上,康奈尔大学团队做的。Vasilopoulou C, Wingfield B, Morris AP and Duddy W. snpQT: flexible, reproducible, and comprehensive quality control and imputation of genomic data [version 1; peer review: 2 approved with reservations]. F1000Research 2021, 10:567 (https://doi.org/10.12688/f1000research.53821.1)

证书和第三方软件

GPL3,流程离不开以下第三方软件,看起来还版本还挺新的:

Software

Version

Reference

License

EIGENSOFT

7.2.1

Price, Alkes L., et al. "Principal components analysis corrects for stratification in genome-wide association studies." Nature genetics 38.8 (2006): 904-909.

Custom open source

impute5

1.0

Rubinacci, Simone, Olivier Delaneau, and Jonathan Marchini. "Genotype imputation using the positional burrows wheeler transform." PLoS Genetics 16.11 (2020): e1009049.APA

Academic use only

nextflow

20.10.0

Di Tommaso, Paolo, et al. "Nextflow enables reproducible computational workflows." Nature biotechnology 35.4 (2017): 316-319.

GPL3

picard

2.24.0

MIT

PLINK

1.90b6.18

Purcell, Shaun, et al. "PLINK: a tool set for whole-genome association and population-based linkage analyses." The American journal of human genetics 81.3 (2007): 559-575.

GPL3

PLINK2

2.00a2.3

Chang CC, Chow CC, Tellier LCAM, Vattikuti S, Purcell SM, Lee JJ (2015) Second-generation PLINK: rising to the challenge of larger and richer datasets. GigaScience, 4.

GPL3

samtools

1.11

Danecek, P.et al.(2021). Twelve years of SAMtools and BCFtools.GigaScience,10(2), 1–4

MIT

shapeit4

4.1.3

Delaneau, Olivier, et al. "Accurate, scalable and integrative haplotype estimation." Nature communications 10.1 (2019): 1-10.

MIT

snpflip

0.0.6

https://github.com/biocore-ntnu/snpflip

MIT

还用了R语言, tidyverse包等。怎样,有没有兴趣用起来呀?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-09-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 科技记者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • snpQT的目标用户:
  • 你需要怎样开始
  • 引用:
  • 证书和第三方软件
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档