前往小程序,Get更优阅读体验!
立即前往
发布
社区首页 >专栏 >获取msigdbr数据库中的基因集失败是什么原因?

获取msigdbr数据库中的基因集失败是什么原因?

作者头像
生信技能树
发布2025-02-06 10:42:50
发布2025-02-06 10:42:50
10300
代码可运行
举报
文章被收录于专栏:生信技能树生信技能树
运行总次数:0
代码可运行

我们每月一期的生信马拉松授课群里有个学员在做GSEA分析的时候报错,下载其中的基因集失败,报错如下:

来看看是怎么回事!

要使用这个包,肯定还是需要对这个 msigdb 数据库有一定的背景知识了解,我们去官网看看现在都更新了哪些基因集合。

1、了解 msigdb 官网

官网地址:https://www.gsea-msigdb.org/gsea/msigdb/index.jsp

我们可以看到 2024 年这个数据库进行了一次大更新,将基因集合分成了人与小鼠两个物种,以前官网只有人类这个物种的基因集。并且小鼠基因集在 2023 年发表在了 Nature Methods 上面。从下面这个图,我们还可以看出上面图片中报错的 m8 类基因集是存在的。

点击 m8,我们可以看到这里包括了 233 个基因集合:

下载 Gene Symbols 的 gmt 格式下来并读入R中:

代码语言:javascript
代码运行次数:0
复制
library(clusterProfiler)
library(org.Hs.eg.db)
library(GSEABase)

## === HALLMARK通路富集
geneset <- read.gmt("data/m8.all.v2024.1.Mm.symbols.gmt")
length(unique(geneset$term))
head(as.data.frame(table(geneset$term)))

2、看看 R 包版本

代码语言:javascript
代码运行次数:0
复制
# 加载包
library(msigdbr)
library(tidyverse)

# 可以看到,这个包涵盖了20个物种
msigdbr_species()

# 包含的类别,并没有M8类别
as.data.frame(msigdbr_collections())


## C5 (ontology gene sets, 15703 gene sets)
genesets <- msigdbr(species = "Mus musculus", category = "C8", subcategory = NULL)
genesets[1:5,1:5]
length(unique(genesets$gs_name))


# 查看目录,与MSigDB一样,包含9个数据集
table(genesets$gs_cat)
table(genesets$gs_subcat)
head(as.data.frame(table(genesets$gs_name)))

# 提取小鼠物种的所有基因集
all_gene_sets <- msigdbr(species = "Mus musculus")
head(all_gene_sets)
table(all_gene_sets$gs_cat)

并没有M8类别,只有C8:

且与人这个物种基因集名一样:

3、我们看看这个R包是怎么得到小鼠物种的基因集吧:

两个官网:

  • https://igordot.github.io/msigdbr/articles/msigdbr-intro.html#helper-functions
  • https://igordot.r-universe.dev/msigdbr

我们可以看到这个包里面的基因是通过同源转换得到的,并且版本停留在 v2023.1.1。

所以,还是推荐大家去官网下载最新数据进行分析!
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 生信技能树 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 来看看是怎么回事!
    • 1、了解 msigdb 官网
      • 官网地址:https://www.gsea-msigdb.org/gsea/msigdb/index.jsp
    • 2、看看 R 包版本
    • 3、我们看看这个R包是怎么得到小鼠物种的基因集吧:
      • 所以,还是推荐大家去官网下载最新数据进行分析!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档