前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用plink软件利用Fisher精确检验关联基因型和表型(GWAS)

使用plink软件利用Fisher精确检验关联基因型和表型(GWAS)

作者头像
用户7010445
发布2024-07-02 16:22:54
780
发布2024-07-02 16:22:54
举报

最近看论文 Genetic subdivision and candidate genes under selection in North American grey wolves,论文里用33个狼的皮毛颜色作为表型去和基因型进行关联分析

方法部分写到

individuals. To test for associations between SNPs near coat colour genes and phenotypic variation within our samples, we performed a case/control association test using both the Fisher’s exact test for allelic association (–fisher) and the full model testing for differences in any genotypes, with permutations for assigning significance (–model –cell 0 –perm) within PLINK

最近发表的甘蓝的泛基因组论文中的关联分析也是用这种方法做的,论文

Large-scale gene expression alterations introduced by structural variation drive morphotype diversification in _Brassica oleracea_

方法部分写到

We adopted the case–control GWAS strategy, which was widely used in disease gene mapping for humans30,31, to identify SVs that were substantially associated with different morphotypes of B. oleracea. Briefly, a GWAS analysis was performed between the case group (individuals belonging to a specific morphotype) and the control group (individuals belonging to all the other morphotypes). Significance was tested by a two-tailed Fisher’s exact test and adjusted by Bonferroni correction.

还有一篇水稻的泛基因组论文也是用的这个方法,论文

Long-read sequencing of 111 rice genomes reveals significantly larger pan-genomes

方法部分写到

Fisher’s exact test was used to detect gene PAV-discrete phenotype associations, and theWilcoxon rank-sum test was used to detect gene PAV-continuous phenotype associations in R v4.0.2. P-values were adjusted using the FDR method, and a threshold of FDR < 0.05 was used to claim a significant gene PAV-phenotype association.

这个是用基因的pav矩阵来做的关联

在网上找了找plink做这个分析的教程

https://www.staff.ncl.ac.uk/heather.cordell/mres2020casecon.html

以下这个链接也可以参考

https://cloufield.github.io/GWASTutorial/06_Association_tests/#significant-loci

输入数据是一个ped文件

ped文件每列的介绍

第7列开始时基因型数据,每两列是一个位点,这个示例数据里是4个位点,所以是8列

还需要一个map文件

map格式介绍

plink做fisher精确检验的命令

代码语言:javascript
复制
plink --ped caseconped.txt --map caseconmap.txt --fisher

输出文件

把vcf文件转换成 ped和map

表型数据是3列 family id 个体id 表型,表型数据的前两列直接用vcf文件里的样本id就可以了,分隔符是Tab或者空格

代码语言:javascript
复制
plink --vcf ../rMVP/smoove_filtered.vcf --pheno pheno.txt --recode12 --allow-extra-chr --allow-no-sex --out smoove

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小明的数据分析笔记本 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档