首页
学习
活动
专区
工具
TVP
发布

GEO数据挖掘

R语言进行数据挖掘
专栏成员
16
文章
2238
阅读量
14
订阅数
转录组—上游分析GSE232120_微生物物种__NCBI下载参考基因组
本次实战的是Hosts Manipulate Lifestyle Switch and Pathogenicity Heterogeneity of Opportunistic Pathogens in the Single-cell Resolution这篇文章。这不是常见的人类或小鼠物种,而是微生物,在上下游处理的过程中与人类或小鼠有所差异。其次我习惯于在ensembl上下载基因组及注释文件,所以首先在这里面查找,但是未找到Serratia marcescens这个物种。本次从NCBI中下载参考基因组及其注释文件。
sheldor没耳朵
2024-09-07
690
转录组GSE105789_小鼠数据下游分析注意事项
简单记录下GSE105789小鼠数据的下游分析的主要事项,与human的数据分析的主要区别是在进行id转换、kegg、go、gsea时,需要注意数据库和物种信息,应该选择小鼠。
sheldor没耳朵
2024-08-21
1300
转录组上游分析—使用iseq下载原始数据、小鼠基因组、单端测序数据处理
进行数据集GSE105789上游分析的时候,总共才四个数据集,使用prefetch下载的时候,不知道网络抽了什么风,速度一直都很慢。下了10个小时才下了三分之一。!
sheldor没耳朵
2024-08-21
1470
转录组-样品表达总体分布及质控可视化
在拿到表达矩阵时我们常常会对其基因表达的总体分布(可选),以及质量控制进行可视化(必须)。这里总结记录相关代码。
sheldor没耳朵
2024-08-14
820
转录组—上游分析_如何拿到count矩阵
本文档记录GSE149638数据集中下载SRR11652578和SRR11652615原始数据
sheldor没耳朵
2024-08-12
1440
转录组分析—再谈GSEA
Gene Set Enrichment Analysis (GSEA) 是一种生物信息学方法,用于确定基因集合(gene sets)在基因表达数据中的显著性变化。它广泛应用于基因表达数据的功能解释,帮助研究者理解在特定实验条件下哪些生物学通路或功能类别是活跃的。以下是GSEA的相关知识点:
sheldor没耳朵
2024-08-05
850
转录组GSE122709—KEGG 富集不出?
在分析GSE122709时候,取D1组、D2组分别与NC组进行基因差异与富集的分析时候,遇到一个问题就是D2/NC比较,进行KEGG分析时候什么结果都没有。查找原因时候遇到了一些问题,这里做简单的记录。
sheldor没耳朵
2024-08-02
1450
转录组GSE157718_Tpm与Count差异分析的比较
在尝试复现GSE157718数据集的时候,发现网站同时提供了表达矩阵tpm形式与count形式,因此分别用这两种形式进行基因差异与富集分析,再进行对比。
sheldor没耳朵
2024-08-01
1150
转录组分析—GSE200033二分组(去除异常值Vs未去除)
直接从GEO官网下载表达矩阵,临床信息表格(存放在Series Matrix File中),放在工作目录下;
sheldor没耳朵
2024-07-31
890
转录组差异分析—基本流程
读取RawCounts.csv文件,其文件形式如下图行名为ensembleid,列名为样本名称。
sheldor没耳朵
2024-07-29
1110
GEO_加权共表达网络WGCNA
WGCNA(Weighted Gene Co-Expression Network Analysis,即加权基因共表达网络分析)是一种用于分析基因表达数据的系统生物学方法。WGCNA的主要目的是识别基因表达数据中的共表达模块,并研究这些模块与外部样本特征(例如,疾病状态、临床特征等)之间的关系。
sheldor没耳朵
2024-07-25
1410
GEO_多组数据联合分析(去除批次效应)
有的时候我们需要用多组数据(来自不同GSM)联合进行分析,或者批次效应较为明显,应该进行去除批次效应的操作。
sheldor没耳朵
2024-07-25
4950
GEO数据挖掘—GSE5883(基于时间序列)
之前把GSE5883数据集按照普通二分组进行分析的,参考GEO数据挖掘-GSE5883
sheldor没耳朵
2024-07-24
1020
GEO数据挖掘—GSE5883
(做这个演练时,虽然实现了目的,但是觉得我的代码very垃圾冗余,希望后续可以找到更好的办法)
sheldor没耳朵
2024-07-23
890
GEO数据挖掘—GSE68183
首先注意到信息表格pd中的title与source_name_ch1列中均含有分组信息,这里我选择了source_name_ch1l列,non-Diabetic Foot skin作为对照,Diabetic Foot skinDFU作为处理组。
sheldor没耳朵
2024-07-23
1430
GEO数据挖掘-基于芯片
在require()函数中,如果直接传递包的名称作为参数,不需要加引号;如果包的名称以字符串形式存储在变量中,则需要使用character.only = TRUE来指定这个变量是一个字符串
sheldor没耳朵
2024-07-23
1510
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档