Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何解读GWAS分析中QQ图和曼哈顿图

如何解读GWAS分析中QQ图和曼哈顿图

作者头像
邓飞
发布于 2023-09-06 02:58:39
发布于 2023-09-06 02:58:39
1.4K0
举报

最近有老师问GWAS可视化的内容,GWAS分析结果没有曼哈顿图和QQ图是没有灵魂的,这两个图究竟怎么看呢,下面介绍一下:

大家好,我是邓飞,GWAS分析应该是可视化最靓的仔了,五颜六色,形状各异,真叫人眼花缭乱,看了又看。

GWAS最直观的结果,就是曼哈顿图,看一下GWAS分析是否理想,就是看有没有点超过了阈值线,类似鲤鱼跃龙门,我们希望它有,但也不希望它太多!

除了曼哈顿图,还有QQ图,它主要是从模型的角度看一下显著位点是否是假阳性。

显著性的位点,怎么能缺少LDblock(LDblock绘制连锁不平衡和单体型图),倒三角缺不了的!

有时候还会绘制LD衰减图(LD衰减图绘制--PopLDdecay)。

做完GWAS只给出显著性位点和注释基因的汇总统计表格,没有几个绚丽的图就不好意思出来见人,如何绘制曼哈顿图和QQ图?(颜值即正义 | 只知道qqman而不知道cmplot是不专业的),还可以将多个性状或者多个环境的曼哈顿图合并(多性状GWAS结果如何合并做曼哈顿图!

图好做,但是怎么看?怎么解读?这篇文章介绍一下!

QQ图和曼哈顿图是嘛意思?

GWAS分析中,会有一个结果,每个SNP的P值,可以根据这个值,以及SNP的染色体和物理位置,进行作图。

常见的图是QQ图和曼哈顿图。比如:

什么是QQ图

QQ图,全称quantile-quantile plot,又称为「分位图」它是判断模型假阳性、假阴性的重要指标。

「为何要用QQ图来表示GWAS的结果呢?」

一般,我们认为,P值达到显著性,那就说明不同的SNP分型,对表型数据是有显著性影响的,但是在GWAS中,我们将显著的原因分为两个部分:

❝第一是自然选择(Selection),我这里所说的自然选择不仅指达尔文在《进化论》中所描述的物竞天择,还指所有对物种适应性有影响作用的“力量”,比如高辐射环境、疾病、病毒等,这也是我们在GWAS研究中真正关心的突变; 第二是遗传漂变(genetics drift),它是一种比较随机的基因组突变而且数量也不少,虽然也是物种演化的一种重要力量,但是由于它的突变都比较随机,目前认为它与环境的变迁没有必然联系,但也会在某些时候,有些随机的突变带来了生存优势,便会在种群中显示出它的作用。但绝大多数情况下,对于已经在群体中稳定存在的性状而言,并不认为它们有明显的作用,所以GWAS研究是不关心这一类突变的,我们要把它们全部排除掉。如果你发现自己得到的结果全部是这样的变异的话,那么,应该重新考虑一下如何重新设计这个分析,包括是否应该增加样本量以及想办法排除技术错误以及干扰因素等方面,或者也可能它们之间就是没有关系。 --https://zhuanlan.zhihu.com/p/59767114,知乎,碱基矿工 ❞

第一个部分,是由于突变导致的表型变异,比如AA变异了AT或者TT,导致产奶量增加,AA比如是10Kg,AT是15Kg,TT是20Kg,而且达到极显著水平,我们可以认为该突变导致产奶量变化,是我们关注的位点或者基因。GWAS的目的就是找到这样的位点,进而找到这样的基因。

第二个部分,是随机遗传漂变,它显示的统计显著性只是偶然,并不是该位点真的影响表型值。随机漂变,是随机在染色体上变化,它符合均匀分布,所以一定范围内有一定的概率。这些位点,是我们需要排除的。

QQ图的x坐标是均匀分布的值(理论值),经过-log10转换了。QQ图的y坐标实际的P值(观测值),经过-log10转换了。

「如果所谓的变异都是遗传漂变引起的:」

那就是这样一个图:横坐标和纵坐标都是在一条直线上,他们是完全一致的,因为X坐标是模拟的均匀分布的P值,而Y坐标是真实的P值,它与X一致,就说明它的分布也是均匀分布的,那我们就可以认为它是随机漂变的产物。

「如果所谓的变异都是遗传漂变引起+真实变异引起的:」

那它的图应该是这样的:刚开始的位点,比如-log10在3之前,都是和均匀分布是一致的,是随机漂变导致的。在大于3之后,均匀分布还是在直线上,但是由于随机漂变+真实位点的存在,开始偏离直线,并且上翘,这些上翘的位点就是我们关注的位点。

所以,好的GWAS分析,有结果的QQ图,都是前期在直线上,后面上翘。有点翘的QQ图才是好的QQ图。

什么是曼哈顿图

首先,曼哈顿是一个地名,是这样的:

因为建筑高低错落有致,我们将GWAS中不同染色体表示不同的位置,将不同SNP的P值比作不同的建筑,就会有种曼哈顿夜景的感觉:

「好的曼哈顿图:」

GWAS分析中,原理就是SNP位点和控制性状的基因存在LD状态,即SNP的分型可以代表基因的不同分型,所以,真实的显著位点应该是在基因两侧分布的,有一个上升和下降的趋势,比如这样的图:

「坏的曼哈顿图:」

只有孤零零的一个点,周围没有显著的点,这很有可能是假阳性,因为GWAS分析和培育品种是类似的:一出出一窝!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-08-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
单倍型与表型显著性分析,显著了有什么用?
之前写了几篇如何计算单倍型的博文:如何计算群体中的单倍型频率,单倍型的显著性分析,以及介绍了为何要做单倍型分析:GWAS分析完,要做单倍型图,还要做单倍型的显著性分析?,以及每个个体的单倍型:单倍型分析:个体所对应的单倍型是?,以及单倍型显著性如何计算:不同单倍型和表型数据的显著性分析
邓飞
2025/06/10
720
单倍型与表型显著性分析,显著了有什么用?
QQ图和曼哈顿图是嘛意思?
GWAS分析,QQ图和曼哈顿图是标配,可是这两个图具体是什么意思?怎么判断好坏,且听我一一道来。
邓飞
2022/04/06
9420
QQ图和曼哈顿图是嘛意思?
GWAS分析效果好坏重点是看QQ图
今天聊一下,GWAS分析后,如何评价结果的好坏。GWAS每个性状,对应不同的模型,比如GLM、MLM、FarmCPU、BLINK等,同样对于性状如果不符合正态分布,也会对数据进行转换,比如log10,反正弦等,这些模型和转换是否更好,如何判断呢?推荐用QQ图整体看看。
邓飞
2025/06/11
1420
GWAS分析效果好坏重点是看QQ图
有哪些标准可以用来评判gwas结果的好坏
今天聊一下,GWAS分析后,如何评价结果的好坏。我们知道GWAS分析有两个可视化的图:R语言如何绘制GWAS的曼哈顿图和QQ图
邓飞
2025/05/08
1300
有哪些标准可以用来评判gwas结果的好坏
GWAS分析完,要做单倍型图,还要做单倍型的显著性分析?
GWAS分析完成后,进行单倍型图分析的核心目的是验证显著性位点的可靠性并深入理解其遗传背景,具体原因包括以下几点:
邓飞
2025/02/20
4670
GWAS分析完,要做单倍型图,还要做单倍型的显著性分析?
如何理解GWAS中Manhattan plot和QQ plot所传递的信息
在GWAS研究中,Manhattan plot和QQ plot是最常画的两类图,它们可以把跟研究的性状(比如,基因型和身高)显著相关的基因位点清晰地展现出来,不少读者朋友应该都懂得如何画这样的图,但我想应该不是每个人都能够真正知道其中所蕴含的道理。
黄树嘉
2019/05/31
2.6K0
GWAS分析中可视化:QQ图和曼哈顿图
大家好,我是邓飞,对于GWAS分析结果,第一个要看的是曼哈顿图,看看有没有显著性的点,没有显著性的点,项目白做了!第二个要看的是QQ图,比较翘就非常理想。下面介绍一下常用的可视化方法,包括:qqman和cmplot两个包。
邓飞
2022/12/13
1.5K0
GWAS分析中可视化:QQ图和曼哈顿图
GWAS分析为何要关注遗传力的大小
通俗来讲,就是可遗传的百分比,如果遗传力很高,那么子代的表现和亲本的表现高度相关,如果遗传力很低,那么子代的表现和亲本的表现相关性很低,之前写过一篇博客,介绍遗传力相关的公式推导:回归系数 相关系数 遗传力之间的关系
邓飞
2024/05/01
3300
GWAS分析为何要关注遗传力的大小
多性状或者多个模型的QQ和曼哈顿重叠图
之前介绍了好几篇QQ图和曼哈顿图的绘制GWAS的曼哈顿图和QQ图diamante,GWAS分析QQ图挺好,曼哈顿图没有显著性,如何调整阈值,今天介绍一下多个性状或者多个模型的QQ图和曼哈顿图如何绘制。这里,整理了示例数据和代码,比葫芦画瓢,很容易复现。
邓飞
2025/02/06
1880
多性状或者多个模型的QQ和曼哈顿重叠图
GWAS分析中曼哈顿图如何添加基因信息
大家好,我是邓飞,虽然我知道GWAS分析后一定是要有曼哈顿图的,没有曼哈顿图的GWAS没有灵魂,但是,谁能想到,需要在曼哈顿图上添加上基因,怎么不在上面画蒙娜丽莎呢???
邓飞
2024/11/25
2030
GWAS分析中曼哈顿图如何添加基因信息
笔记 | GWAS 操作流程3:plink关联分析--完结篇
注意,这里我使用的是ped和map格式,如果ped文件中有表型数据(第六列),如果想指定表型数据,用--pheno,包括三列:家系,个体,表型值。
邓飞
2020/05/13
9.4K1
GWAS分析竟然发表6分的文章!!!
大家好,gwas分析目前已经很普及,很多育种群体非常适合gwas的数据挖掘,很多人类群体也非常适合gwas的位点挖掘。
邓飞
2024/04/10
3520
GWAS分析竟然发表6分的文章!!!
使用TASSEL学习GWAS笔记(4/6):一般线性模型进行GWAS分析(GLM模型)
GLM模型中,将每个SNP作为固定因子进行回归分析,进行显著性检验,P值就是GWAS分析的p-value,effect就是SNP的effect值。如果有其它因素需要考虑,就放到协变量里面,比如性别,PCA,Q矩阵等。
邓飞
2021/09/03
3K0
使用TASSEL学习GWAS笔记(4/6):一般线性模型进行GWAS分析(GLM模型)
文献解读-Identification of Key Candidate Genes for Beak Length Phenotype by Whole-
鹅是全球重要家禽,中国是最大养殖国。兴国灰鹅(XGG)因优良生长性能被列入国家畜禽遗传资源保护名录。喙部作为鹅类摄食关键器官,其发育机制研究对提升生长性能具有重要意义,但目前关于家鹅喙长性状的遗传研究相对匮乏。
INSVAST
2025/04/16
780
文献解读-Identification of Key Candidate Genes for Beak Length Phenotype by Whole-
R语言ggplot2绘制曼哈顿图展示GWAS分析的结果
之前分享过一篇推文介绍过这个内容 R语言ggplot2包画曼哈顿图的一个简单小例子,但是当时自己不太懂曼哈顿图,实现是直接借助ggplot2的geom_jitter()这个函数实现的。这个函数并不会考虑每个变异位点的位置,而实际的曼哈顿图是需要根据变异位点的位置来画的。今天的推文重新介绍一下ggplot2绘制曼哈顿图的代码。数据集就使用之前的推文中用到的数据跟着Nature Genetics学GWAS分析:emmax软件gwas分析/qqman包展示结果,这个数据太大,出图有些慢,只随机选取了其中1%的数据 (这个数据我自己的存储路径population.genomics/gwas/NG.tomato/at/)。
用户7010445
2023/09/21
1.1K0
R语言ggplot2绘制曼哈顿图展示GWAS分析的结果
统计遗传学:第四章,GWAS分析
大家好,我是邓飞,今天继续介绍《统计遗传学》这本书,本次介绍第四章:GWAS分析,主要是综述介绍,具体的实操介绍要到八九十章节。
邓飞
2022/07/27
2K0
统计遗传学:第四章,GWAS分析
2.5万汉族人的GWAS乳腺癌风险基因
今天是大年初七,给大家带来的是2.5万汉族人的GWAS乳腺癌风险基因,希望你能学到知识。
生信技能树
2019/03/07
1.6K0
2.5万汉族人的GWAS乳腺癌风险基因
统计遗传学:第三章,群体遗传
前几天推荐了这本书,可以领取pdf和配套数据代码。这里,我将各个章节介绍一下,总结也是学习的过程。
邓飞
2022/07/27
9590
统计遗传学:第三章,群体遗传
多性状GWAS结果如何合并做曼哈顿图!
这里,将multracks = TRUE,设置一下,出两个图,一个是按照顺序叠加图,一个是同一个坐标下合并图。
邓飞
2022/12/13
1.3K0
多性状GWAS结果如何合并做曼哈顿图!
manhattanly--一个R包拿下曼哈顿图+QQ图+火山图!
对于一些研究领域,如GWAS、EWAS研究,常常会用到曼哈顿图可视化基因组中与表型相关的潜在感兴趣区域、QQ图表示观察到的检验统计量的分布假设、火山图是针对其效应大小、优势比或对数倍数变化绘制的-log10 p值。今天小编给大家介绍的这个R包manhattanly,整合了这几种常用的绘图方式,可以方便的进行分析可视化!
作图丫
2022/03/29
7980
manhattanly--一个R包拿下曼哈顿图+QQ图+火山图!
相关推荐
单倍型与表型显著性分析,显著了有什么用?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档