蛋白组学全流程分析教学视频
b站教学视频有公共数据库和自测质谱蛋白组学全流程分析作图教程
https://www.bilibili.com/video/BV1tdR5YPELW/
图文教程
1.全球最大的蛋白组学Proteomexchange数据库的蛋白组学数据下载
Proteomexchange数据库网址: https://www.proteomexchange.org/
当前该数据库中已经收录了4万多个各种物种的蛋白组学数据集,数据集编号是PDX开头,类似于GEO的GSE数据集,且数据集的数量还在逐年增加。
具体的PDX蛋白组学数据集下载教程参考我这个b站教学视频: https://www.bilibili.com/video/BV1tdR5YPELW/
2.使用maxcount来对蛋白组学的.raw原始数据进行搜库得到蛋白的定量数据
蛋白组学数据最常用的搜库软件是MaxQuant(https://www.maxquant.org/),可以进入该官网下载MaxQuant软件,maxquant是一个独立的windows零代码蛋白组搜库软件,网上也有比较多比较详细的图文教程和视频教程,我这里没有出maxcount的使用教程,建议大家在网上学习maxcount的教程来使用maxcount进行蛋白组的搜库处理。
MaxQuant的鉴定及定量表格会以txt格式保存于combine文件夹下属的txt文件夹中,其中proteinGroups.txt文件中关于蛋白的鉴定及定量信息是各类蛋白质组学研究中最常用最重要的数据。
3.从Maxcount的搜库结果proteinGroups.txt文件中提取出蛋白组的表达矩阵
软件位置和分析界面
分析结果
4.蛋白组学表达矩阵的归一化处理
归一化处理分析模块
该节教程: https://www.bilibili.com/video/BV1fJ4m1u7jX/
样本PCA分群聚类分析和剔除异常样本
样本的PCA聚类分群分析
该节教程:https://www.bilibili.com/video/BV1if421X7pM/
删除PCA分群聚类的异常离群样本
该节教程:https://www.bilibili.com/video/BV1Um421N7X8/
剔除异常离群样本后的再次PCA聚类分群分析
该节教程:https://www.bilibili.com/video/BV1if421X7pM/
5.多个数据集的整合和去除批次效应
多个数据集合并 (如何需要整合分析多个数据集,就运行这一步)
该节教程:https://www.bilibili.com/video/BV1j4421X7Ls/
多数据集合并后一起所有样本表达数据一起做归一化处理
该节教程: https://www.bilibili.com/video/BV1fJ4m1u7jX/
去除批次效应
https://www.bilibili.com/video/BV1vD421g7Vj/
,都是需要要去除批次效应的,但是,即使单个数据集中如果有多个批次信息,也要运行这一步
该节教程: https://www.bilibili.com/video/BV1Yy411h78f/
去除批次效应后的样本PCA聚类分群分析
该节教程:https://www.bilibili.com/video/BV1if421X7pM/
删除PCA分群聚类的异常离群样本
该节教程:https://www.bilibili.com/video/BV1Um421N7X8/
剔除异常离群样本后的再次PCA聚类分群分析
该节教程:https://www.bilibili.com/video/BV1if421X7pM/
6.差异分析
蛋白组学是跟基因表达芯片一样类似的连续数据,所以这里也是使用limma来做差异分析
在我的OmicsTools差异分析模块用limma做差异分析时,是会自动对数据分布和量级差别较大的数据进行取对数处理的。所以,大家也不需要手动对这类数据提取进行取对数处理的。
基因芯片或其它组学或连续数值的表达矩阵的差异分析时,一律是log2(表达矩阵)+limma工具差异分析这种方法。在我的OmicsTools差异分析模块用limma做差异分析时,是会自动对数据分布和量级差别较大的数据进行取对数处理的。所以,大家也不需要手动对这类数据提取进行取对数处理的。
通用差异分析 (各种类型的组学数据都适用的差异分析模块)
该节教程:https://www.bilibili.com/video/BV1Lw4m1q71T/
这个差异分析模块是可以做任意物种的差异分析,如果是人,func_org参数就填’human’, 如果不是人,就填不是’human’的任意其它物种名称就行。
因为edgeR差异分析建议,如果是人类的RNAseq数据,bcv生物变异度设置为0.4,如果是非人类的模式生物,bcv设置为0.1,在用edgeR做差异分析时,所有当输入的物种是human的时候,会自动把bcv生物变异度设置为0.4, 非human的时候,bcv会设置为0.1
通用批量差异分析(可同时对多个数据集文件做差异分析)
该节教程: https://www.bilibili.com/video/BV1vD421g7Vj/
按照某个基因或特征的高低分组的差异分析 按照某些特征的高低阈值对样本进行分组
该节教程:https://www.bilibili.com/video/BV1CZ421M75J/
按照某个基因或特征的高低分组的差异分析
按照某个基因或特征的高低分组的差异分析
该节教程:https://www.bilibili.com/video/BV18E4m1R7Wp/
这个差异分析模块也是可以做任意物种的差异分析,如果是人,func_org参数就填’human’, 如果不是人,就填不是’human’的任意其它物种名称就行。
因为edgeR差异分析建议,如果是人类的RNAseq数据,bcv生物变异度设置为0.4,如果是非人类的模式生物,bcv设置为0.1,在用edgeR做差异分析时,所有当输入的物种是human的时候,会自动把bcv生物变异度设置为0.4, 非human的时候,bcv会设置为0.1
根据logFC和p值等条件对差异分析结果进行筛选
提取出符合条件的特定行列的子数据集
该节教程: https://www.bilibili.com/video/BV1BM4m1Q7Qx/
7.差异分析的结果可视化
热图绘制 根据所有差异基因绘制基因表达的聚类热图
视频教程:https://www.bilibili.com/video/BV13m421g7wv/
绘制top差异基因表达的聚类热图
视频教程:https://www.bilibili.com/video/BV1jZ42147KP/
火山图绘制
该节教程: https://www.bilibili.com/video/BV1DJ4m177oB/
箱式图绘制
8.通路富集分析
GO和KEGG通路富集分析
该节教程: https://www.bilibili.com/video/BV1Ff421X7Fj/
分析窗口
分析结果
结果文件列表
GO通路富集分析结果图
KEGG通路富集分析结果图
GSEA富集分析
各种通路基因集下载
可以从最常用的MSigDB数据库(https://www.gsea-msigdb.org/gsea/msigdb/index.jsp)下载我们感兴趣的基因集
MSigDB中人类的通路基因集
2.1 GSEA富集分析
该节教程:https://www.bilibili.com/video/BV1XM4m1z7SJ/
2.2 将多个GSEA富集结果绘制在一张图中
该节教程:https://www.bilibili.com/video/BV1Rw4m1i7Ux/
GSVA/ssGSEA富集分析
1.1GSVA/ssGSEA每个样本的富集分数计算
1.2GSVA/ssGSEA富集得分矩阵的可视化作图
1.2.1GSVA/ssGSEA富集得分矩阵热图绘制展示
1.2.2GSVA/ssGSEA富集得分矩阵的批量差异分析
1.2.3差异分析的箱式图作图
1.2.4GSVA/ssGSEA富集得分矩阵跟基因表达的相关性分析
OmicsTools软件和分析教程介绍
前言和简介
OmicsTools全能医学生物生信分析电脑软件简介
我开发了一款全网最强大的本地电脑无限使用的零代码生信数据分析作图神器一站式全流程电脑软件OmicsTools,旨在成为可以做各种医学生物生信领域科研数据分析作图的的全能科研软件,欢迎大家使用OmicsTools进行生物医学科研数据分析和作图,该软件件能让大家在不需要任何编程和代码编写的基础上,分析次数没有限制,可以无限使用,让您在自己电脑上快速进行大量的生信分析和加速大家的科研。
OmicsTools生信分析电脑软件可以做医学生物生信各个领域的科研数据分析和作图,并致力于成为医学生物生信领域的综合全能分析软件,一个软件帮助大家做医学生物生信领域的各种研究,快速出成果。
现在1群满员,会提示加2群,2群也可以下载到软件。
可以提供的科研服务清单
领取专属 10元无门槛券
私享最新 技术干货