前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >GWAS分析中的GO和KEGG富集分析教程

GWAS分析中的GO和KEGG富集分析教程

作者头像
邓飞
发布于 2024-12-10 05:05:04
发布于 2024-12-10 05:05:04
48600
代码可运行
举报
运行总次数:0
代码可运行

大家好,我是邓飞,上一次,我们介绍如何根据显著性snp,使用bedtools根据上下游距离,根据gff文件注释基因。(显著SNP的基因注释教程!)

这一次,介绍一下如何根据注释的基因,进行富集分析,主要是看一下GWAS定位的基因有没有某一个趋势,也算是一种验证的方法。比如籽粒大小找到的30个候选基因,如果都与籽粒发育相关的生化途径一致,那就说明找到的都是相关的基因。

之前用于注释基因需要的gff文件:

上面红框中就是基因的名字,这里,我们已经注释到的基因,形成一个txt文件,内容如下:

1. R包依赖

下面先载入需要的R包,如果没有安装,需要安装一下:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  library(clusterProfiler)
  library(enrichplot)
  library(topGO)
  library(Rgraphviz)
  library(openxlsx)
  library(ggplot2)

2. 下载数据库

到Bioconductor中(https://www.bioconductor.org/),检索该物种的数据库

常见的物种数据库如下:直接在Bioconductor中安装OrgDB的名称就行了。

这里,我们用的是水稻的数据库,名称为:org.Osativa.eg.db

注意:包的下载地址:https://github.com/xuzhougeng/org.Osativa.eg.db

3. 载入数据库和读取基因名文件

「载入数据库」

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
library(org.Osativa.eg.db)
db <- org.Osativa.eg.db 
organism <- "dosa" # 物种的名称

「读取基因型文件」

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
geneid = read.csv("gene_total.txt",header = F)
head(geneid)

4. 将ID匹配GID

将geneID,替换为数据库中的GID

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
map_id = AnnotationDbi::select(db, keys = geneid, columns=c("GID"), keytype = "RAP")
head(map_id)

5. 对基因列表进行GO注释

GO注释包括:

  • MF注释
  • CC注释
  • BP注释

「MF注释:」

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
go_MF =enrichGO(map_id$GID, 
                 OrgDb=db,
                 keyType = "GID",
                 ont="MF", 
                 pvalueCutoff=1,
                 qvalueCutoff=1, 
                 pAdjustMethod="none")
write.xlsx(go_MF,"go_MF.xlsx")
dotplot(go_MF,color="pvalue")
ggsave("go_MF_dotplot.pdf",width=12,height=6)

结果文件:

同样的,CC和BP的GO注释,将ont后面的改为CC和BP即可。

「CC的GO注释:」

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## CC
go_CC =enrichGO(map_id$GID, 
                OrgDb=db,
                keyType = "GID",
                ont="CC", 
                pvalueCutoff=1,
                qvalueCutoff=1, 
                pAdjustMethod="none")
write.xlsx(go_CC,"go_CC.xlsx")
dotplot(go_CC,color="pvalue")
ggsave("go_CC_dotplot.pdf",width=12,height=6)

「BP的GO注释:」

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## BP
go_BP =enrichGO(map_id$GID, 
                 OrgDb=db,
                 keyType = "GID",
                 ont="BP", 
                 pvalueCutoff=1,
                 qvalueCutoff=1, 
                 pAdjustMethod="none")
write.xlsx(go_BP,"go_BP.xlsx")
dotplot(go_BP,color="pvalue")
ggsave("go_BP_dotplot.pdf",width=12,height=6)

其它类型的图:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
## 其它类型的图:
barplot(go_BP)
heatplot(go_BP)

6. KEGG富集分析

把基因型的ID后面加上“-01”,并且把g变为t

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
rap_id <- paste0(geneid, "-01")
rap_id <- gsub("g","t",rap_id)
head(rap_id)

富集分析:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
geneid = read.csv("a1.txt",header = F)$V1
rap_id <- paste0(geneid, "-01")
rap_id <- gsub("g","t",rap_id)
head(rap_id)
kegg <- enrichKEGG(
  gene = rap_id,  #基因列表文件中的基因名称
  keyType = 'kegg',  
  organism = 'dosa', 
  pAdjustMethod = 'fdr',  #指定 p 值校正方法
  pvalueCutoff = 1,  
  qvalueCutoff = 1)  

运行日志:

作图:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
barplot(kegg)
dotplot(kegg)
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 育种数据分析之放飞自我 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AIGC企业知识库系统的全方位应用
在知识爆炸的时代,企业如同航行在浩瀚信息海洋中的巨轮,每一滴知识的浪花都可能成为推动其破浪前行的动力。而 AIGC企业知识库系统可以帮助企业精准捕捞、高效利用这些宝贵资源,不仅重塑了企业知识管理的版图,更引领了一场前所未有的知识革命。以下是AIGC企业知识库系统的主要应用方式:
企业运营学堂
2024/08/21
4040
AIGC企业知识库系统的全方位应用
智能客服落地后知识库配置太繁琐?试试AI问答+AI知识库!立省80%工作量!
在数字化转型的浪潮中,智能客服系统以其高效、便捷的特点,成为了众多企业提升客户服务体验的重要工具。然而,当智能客服系统真正落地实施后,许多企业却发现了一个不容忽视的问题:知识库的配置工作异常繁琐,严重制约了智能客服系统的效能发挥。本文将探讨这一行业痛点,寻找解决方案,帮助企业节省高达80%的工作量,实现知识库配置的智能化与自动化。
企业运营学堂
2024/08/30
3050
智能客服落地后知识库配置太繁琐?试试AI问答+AI知识库!立省80%工作量!
智能化升级:AI在客服知识库中的应用
在数字化时代,客户服务已成为企业竞争的关键一环。随着人工智能(AI)技术的飞速发展,传统客服模式正经历着前所未有的变革。AI与客服知识库的深度融合,不仅极大地提升了客服处理的效率与准确性,还为用户带来了更加个性化、高效的服务体验。
企业运营学堂
2024/09/03
4490
智能化升级:AI在客服知识库中的应用
大厂都在用什么工具搭建内部知识库?
企业内部知识库是组织智慧与经验的宝贵仓库,它集中存储了员工的专业知识、项目案例、解决方案及最佳实践。通过高效检索与共享,知识库促进了信息流通,加速了新员工融入与学习曲线,提升了团队整体效能与创新能力。同时,它确保了关键知识的连续性与安全性,为决策制定提供了坚实的数据支持,是企业持续发展与竞争力提升不可或缺的基础设施。
企业运营学堂
2024/08/28
4940
大厂都在用什么工具搭建内部知识库?
高效智能 | 客户运营与知识库管理系统的融合策略
在当今快速变化的商业环境中,企业不仅要关注产品的创新和市场的拓展,更需要深耕客户运营,以提升客户满意度和忠诚度。而知识库管理系统作为支撑客户运营的重要工具,其与企业客户运营策略的深度融合,正成为企业提升核心竞争力的关键。
企业运营学堂
2024/09/06
1720
高效智能 | 客户运营与知识库管理系统的融合策略
震惊!开源AI知识库PandaWiki,5分钟部署,24小时在线!
本公众号专注于分享网络工程(思科、华为),系统运维(Linux)、以及安全等方面学习资源,以及相关技术文章、学习视频和学习书籍等。期待您的加入~~~关注回复“724”可领取免费学习资料(含有书籍)。
释然IT杂谈
2025/06/12
3150
震惊!开源AI知识库PandaWiki,5分钟部署,24小时在线!
5个惊人策略:打造完美的企业内部知识库
在这个快速变化的商业环境中,拥有一个结构化和高效的内部知识库不再是可选项,而是企业成功的必需品。SaaS(Software as a Service,软件即服务)平台的兴起,为企业打造这样的内部知识库提供了强有力的技术支持和灵活的部署方案。
企业运营学堂
2024/09/02
2160
5个惊人策略:打造完美的企业内部知识库
企业数字化转型背景下的企业知识管理挑战与经验杂谈
在数字化转型的浪潮下,企业知识管理正面临前所未有的挑战。随着数据量的急剧增长,企业内部积累的信息呈现出碎片化、分散化的趋势,传统的知识管理体系已难以有效应对这一变革。首先,信息碎片化问题日益严重,企业内部的知识资源往往存储在不同的系统和平台中,如文档管理系统、邮件、数据库、会议记录等,这些信息缺乏统一的组织和标准化的分类方式,导致员工在查找所需信息时往往需要耗费大量时间。此外,多源异构的数据格式也加剧了信息整合的难度,使得知识难以被高效利用。
熊猫钓鱼
2025/05/14
1100
【2024年】6款搭建AI知识库的最佳SaaS软件
现如今,越来越多的企业开始意识到搭建高效、智能的AI知识库是非常重要的,并在不断了解和搭建AI知识库。如何高效搭建出有效的AI知识库是很多企业存在的问题。在2024年,有哪些SaaS软件是搭建AI知识库的最佳软件呢?本文将推荐6个用于搭建AI知识库的最佳SaaS软件。
企业运营学堂
2024/09/06
3280
【2024年】6款搭建AI知识库的最佳SaaS软件
Notion 替代方案: SaaS公司怎样在线搭建企业知识库?
在追求高效与创新的道路上,工具的选择至关重要。近期,OpenAI推出的Sora及其高端加速版本Sora Turbo在视频生成领域引发了轰动。
HelpLook AI知识库
2024/12/18
1970
Notion 替代方案: SaaS公司怎样在线搭建企业知识库?
如何利用AI优化知识中台的用户体验
在数字化时代,知识中台作为企业知识管理与服务的重要载体,其用户体验的优劣直接关乎到信息的有效传递、员工的学习效率及企业的整体创新能力。随着人工智能(AI)技术的飞速发展,将AI融入知识中台的设计与优化中,已成为提升用户体验、增强用户满意度与参与度的重要途径。本文将从用户界面优化、智能交互设计、个性化推荐及持续学习优化四个方面,探讨AI如何助力知识中台的用户体验升级。
企业运营学堂
2024/09/05
2920
如何利用AI优化知识中台的用户体验
有哪些值得关注的知识库&知识管理工具?
在当今信息爆炸的时代,知识可谓企业最宝贵的无形资产。有效的知识管理不仅能减少信息壁垒,还能加速决策过程、降低培训成本并促进创新,因而成为企业数字化转型的核心战略。今天就让我们一起来看看2025年16款值得关注的知识管理工具,寻找不同场景下的知识管理最优解。
用户11699870
2025/06/12
1360
知识库管理系统的未来趋势:从单一平台到生态系统
在数字化浪潮的推动下,知识库管理系统(Knowledge Base Management System, KBMS)正逐步从传统的单一平台向更加开放、灵活、智能的生态系统转变。这一转变不仅体现了技术进步的必然结果,也深刻反映了市场需求的变化。本文将分析随着技术的发展和市场需求的变化,知识库管理系统如何向生态系统方向发展,并探讨这一趋势对企业的影响。
企业运营学堂
2024/09/23
1920
知识库管理系统的未来趋势:从单一平台到生态系统
8月功能更新 | HelpLook知识库管理全面升级,加速知识转化与分享
HelpLook在8月更新了哪些内容呢?本次更新涵盖了文件上传新体验、搜索结果关键词高亮,以及新增3种语言支持、AI大模型升级等多个功能,确保用户能够更高效地转化企业内外部知识为实际解决方案。
HelpLook AI知识库
2024/09/03
2150
8月功能更新 | HelpLook知识库管理全面升级,加速知识转化与分享
AI助理驱动的企业知识库:从数据海洋到知识金矿的转变
在当今这个信息爆炸的时代,企业面临着前所未有的数据洪流。这些数据,无论是来自市场趋势、客户反馈、内部运营还是外部研究,都蕴含着巨大的价值,但同时也带来了筛选、整合与应用的巨大挑战。如何在这片数据海洋中捞出真金白银,成为企业提升竞争力、实现可持续发展的关键。AI助理的兴起,为企业构建高效、精准的知识库,实现从数据海洋到知识金矿的转变提供了强有力的支持。
企业运营学堂
2024/09/12
2310
AI助理驱动的企业知识库:从数据海洋到知识金矿的转变
驾驭未来:知识图谱与工业智能问答
ChatGPT 是美国人工智能研究实验室 OpenAI 开发的一种全新聊天机器人模型,能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,支持回答问题、承认错误、质疑并拒绝不适当的请求等情境。
黄成甲
2023/11/10
8190
驾驭未来:知识图谱与工业智能问答
【AI落地应用实战】大模型加速器2.0:基于 ChatDoc + TextIn ParseX+ACGE的RAG知识库问答系统
在当今数字化浪潮席卷各行业的时代,企业内部信息管理的难题愈发凸显,构建高效的知识库已成为企业发展的必然选择。
中杯可乐多加冰
2025/03/29
1380
重磅!腾讯智能工作台ima,获信通院AI大模型应用精选案例奖
近日,信通院公布首批“开源大模型+”软件创新应用典型案例奖,基于一栈式AI搜索解决方案Elasticsearch Service与大模型打造的腾讯智能工作台ima被评为精选案例。
腾讯QQ大数据
2025/05/17
2590
重磅!腾讯智能工作台ima,获信通院AI大模型应用精选案例奖
数据万象 x DeepSeek大模型,AI 问答助力存储文档“活”起来
用户无需进行代码开发或模型部署,即可为您的每一个存储文档搭建智能问答助手,让 DeepSeek 的深度思考能力转化为知识梳理的生产力工具。
云存储
2025/03/17
1890
数据万象 x DeepSeek大模型,AI 问答助力存储文档“活”起来
IntFinQ知识库体验:大模型加速器2.0,助力企业走向文档智能化
在数字化转型浪潮中,企业文档处理正面临「数据爆炸」与「认知过载」的双重挑战。合合信息Textin最新推出的「大模型加速器2.0」正在重新定义企业级文档智能化的边界。本文将带您深入体验这场文档认知革命的核心技术突破。
Damon小智
2025/04/02
850
IntFinQ知识库体验:大模型加速器2.0,助力企业走向文档智能化
推荐阅读
相关推荐
AIGC企业知识库系统的全方位应用
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验