首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

🤩 WGCNA | 值得你深入学习的生信分析方法!~(网状分析-第二步补充-大数据的网络构建与模块识别)

1写在前面 之前我们完成了WGCNA输入数据的清洗,网络构建和模块识别。...---- 但这里我们的示例数据内所含有的基因其实是很少的,而在实际情况中,一个简单的测序可能就要包含上万个基因,这对大家的电脑无疑是不小的压力。...在WGCNA的包内其实也提供了解决方案,基本思想是分级聚类。 ---- 1️⃣ 首先,我们使用快速但相对粗糙的聚类方法,用于将基因预聚类成大小接近的模块,且不超过你所设定的基因最大值。...2用到的包 rm(list = ls()) library(WGCNA) library(tidyverse) 3示例数据 load("FemaleLiver-01-dataInput.RData")...load(file = "FemaleLiver-02-networkConstruction-auto.RData") ---- 6.2 匹配颜色 把colors和label匹配起来,嘿嘿。

46461
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    关键问题答疑:WGCNA的输入矩阵到底是什么格式

    请问用tcga做wgcna分析,原始数据输入tpm和fpkm格式都行吗? 如果下的raw_count有r包转换吗?...,只需要基因的表达量是适合计算相关性的即可,如果是 原始 counts值,可以直接转为 log(cpm+1) 的格式 ,更为重要的其实是挑选多少个基因进入后续的wgcna流程。...,并且使用指定函数来对其元素进行处理。...#函数split()可以按照分组因子,把向量,矩阵和数据框进行适当的分组; #它的返回值是一个列表,代表分组变量每个水平的观测。...toTable(org.Mm.egSYMBOL) head(s2g) g_l=merge(g_l,s2g,by='gene_id') #把g_l,s2g两个数据框以'gene_id'为连接进行拼接 #merge函数可以实现对两个数据表进行匹配和拼接的功能

    3.5K41

    lncRNA实战项目-第六步-WGCNA相关性分析

    读入原始表达数据 原始数据包含64个样本,9904个lncRNA表达量,这时的矩阵行为基因,列为样本信息,其中第一列是lncRNA ID,(这里的lncRNA ID是cufflinks 组装时给的自由的...fpkm 准备表型信息 这里有64个样本,包含猕猴脑不同空间区域,不同发育时期,以及性别,因为每个样本都交叉包含着三种不同的信息,如果选择全部表型信息,我试了试,后续的模块和性状完全看不清关系,所以我这里仅选择脑不同区域的表型信息...sample.Info 下载并载入WGCNA包 source("http://bioconductor.org/biocLite.R") #biocLite(c("AnnotationDbi", "impute...", "GO.db", "preprocessCore")) ##如果上面的包已经下载过了,就不用下载 biocLite("WGCNA") library(WGCNA) 行列转置 WGCNA针对的是基因进行聚类...Soft Threshold ---- STEP3: 一步法构建共表达矩阵 一步法构建网络,使用函数blockwiseModules(), 这个函数包含很多参数,其中power=sft$powerEstimate

    5.2K112

    Radius协议-学习

    PAP 验证 用户以明文的形式把用户名和他的密码传递给NAS,NAS把用户名和加密过的密码放到验证请求包的相应属性中传递给RADIUS服务器。...NAS可以在其中包含服务类型属性Attribute Service-Type=Framed-User,和Framed-Protoco• =PPP作为提示来告诉RADIUS服务器PPP是所希望的服务。...RADIUS服务器的CoA-Request报文或DM-Request报文与设备上的用户信息匹配失败时,设备会在回应的CoA-NAK报文或DM-NAK报文中通过错误码描述失败的原因。...QoS模板不存在或QoS模板中未配置用户队列授权的上下行优先级超过最大值授权的UCL组索引值不在规格范围内解析ISP VLAN和出端口信息错误重认证属性与其他属性同时授权 RD_DM_ERRCODE_SESSION_CONTEXT_NOT_FOUND...包括:当前针对请求用户的授权正在处理申请RADIUS临时表失败用户信息不匹配或未找到用户用户非RADIUS认证用户 RD_DM_ERRCODE_RESOURCES_UNAVAILABLE 506 其他授权失败的情况使用该错误码

    2.6K30

    WGCNA加权基因共表达网络一步法分析学习

    # `verbose = 0`:不产生任何输出,只返回结果,通常用于静默模式。# `verbose = 1`:产生基本的信息输出,以提供一些关于函数执行进度的信息。...powers, verbose = 5)sft$powerEstimate# pickSoftThreshold 函数的输出,用于选择最佳的软阈值以构建基因共表达网络或网络模型。...# powerEstimate:这是估计的最佳软阈值的值,它是一个整数。在这个结果中,估计的最佳软阈值是6。# fitIndices:这是一个数据框,包含了不同软阈值下的拟合指标。...# verbose = 3:用来控制输出的详细程度。设置为3可以输出较为详细的信息,用于跟踪函数的执行进程。# corType:用来选择计算相关性的方法。...注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟 - END -

    18410

    WGCNA:加权基因共表达网络分析

    构建加权相关性基因网络软阈值的选择 WGCNA中对基因表达值之间的相关系数取n次幂,这是和普通聚类的最大不同,其直接结果是把基因间相关性的强弱的差异放大。...WGCNA提供几种相关性的算法,其中包括Pearson correlation(cor()函数)、Biweight mid-correlation(bicor()函数)、Spearman correlation...(cor(x, method=“spearman”)函数)本研究中采用WGCNA默认的Pearson相关,Pearson correlation计算快速,但对离群值敏感。...WGCNA给出了如何选择这个阈值的方法,其函数是pickSoftThreshold()。 2 加权共表达网络的构建和模块识别 一旦选择好了构建网络的β值,那么从网络构建到模块识别需要四个步骤。...因为前面已经得到了ME,所以可以利用cor(MEs, datTraits)函数计算模块与外部信息的相关系数,并且可以计算其p值,WGCNA提供了其相关性可视化的函数labeledHeatmap(),结果得到的是每个模块与外部特征的相关性矩阵

    3.8K53

    WGCNA仅仅是划分基因模块,其它都是附加分析

    用于分析的样本需要包含非常丰富的变化信息,才能将基因归类成有生物学意义的模块。...、以及是否输出过程信息 # 输出结果为一个包含有关于不同power下拟合优度、均值连接度、平均k值等的信息表 sft <- pickSoftThreshold(datExpr,...::cor # blockwiseModules函数构建加权共表达网络,并识别基因模块 net <- blockwiseModules( datExpr, # datExpr是包含基因表达数据的矩阵...,如果需要多次分析,可以将其存储起来供后续使用 verbose = 3 # 控制输出信息的详细程度,数值越大输出的信息越多 ) # 统计每个模块中基因的数量 table(net$colors...,方便后续的分析和可视化使用 save(net, moduleColors, file = "step3_genes_modules.Rdata") 这里面需要注意一个同名函数的报错 WGCNA包的blockwiseModules

    1.2K20

    从原始芯片.cel数据到权重基因共表达网络(WGCNA)详细流程

    输出的是模块颜色,模块特征基因,而这些可以用于后续的分析。同时,user也可以把模块检测的结果可视化智能模块检测的功能有很多参数,并且在作者的例子里,大多数都采取了默认值。...我们现在演示一种方法,这个也内嵌入了WGCNA包,而这可以让user用这么大的数据进行网络分析。实际上不是使用这么大的数据,软件包会假装电脑硬件不允许使用多于2000个gene进行分析。...2.定义基因网络形成的邻接函数 其实最直接的是对基因间的cor设定硬性阈值,结果要么是有关联要么是无关联。但这会丢失很多信息,前已述及。Wgcna为了克服,提供两种软阈值。...两种类似,我们采取其中的幂指数邻接函数方法。就是对每对基因的相关系数进行ß次方幂指数运算,将其加权,其中ß称之为软阈值那么如何选择这个值呢。...并将显著性p值的以10为底的对数值定义为基因显著性(gene significance,GS),再将模块的显著性(module significance,Ms)定义为模块包含的所有基因显著性性的平均值,

    3.3K42

    Nature文章复现|早期肺鳞状癌发生过程中关于肿瘤侵袭前免疫逃逸机制的表达量芯片研究

    载入R包 我们先下载需要载入的R包,代码来源于文献提供的代码: GitHub - Precancer/SCC: Immune evasion before tumor invasion in early...cor函数,这里是把WGCNA包的cor函数设为优先级最高的 cor WGCNA::cor net = WGCNA::blockwiseModules(set, power = 6, minModuleSize...WGCNA包的, #可能调用了stats包或别的包的cor函数,需要将WGCNA包的cor函数设为优先级最高的 #Error in (new("standardGeneric", .Data = function...,通路中默认最少要包含10个基因,物种默认为人类 #p值校正方法BH法,结果显示阈值:p值小于0.05,padjust结果显示阈值为空 mSigdb_enrich包含了若干向量的列表(lt),第二个参数是一个向量(x)。 #其中x会和lt中的每一个向量进行intersection。

    29410

    一文看懂WGCNA 分析(2019更新版)

    不过,我这点战绩根本就算不上什么,其实这个WGCNA包已经是十多年前发表的了,仍然是广受好评及引用量一直在增加,破万也是指日可待。 ?...因此,WGCNA分析时采用相关系数加权值,即对基因相关系数取N次幂,使得网络中的基因之间的连接服从无尺度网络分布(scale-freenetworks),这种算法更具生物学意义。...基因的模块可视化 这里的重点就是plotDendroAndColors函数,它接受一个聚类的对象,以及该对象里面包含的所有个体所对应的颜色。...样本的聚类可视化 可以看到这些乳腺癌的细胞系的表达谱聚类情况并不是完全与其分类匹配,所以仅仅是根据样本的分组信息做差异分析并不完全准确。...包自带的热图就很丑。

    30.3K3223

    2023-10(数据挖掘马拉松)答疑汇编

    下面那个是错误的,x=c(1,2);表(x);x=(1,2);table(x);下面代码缺一个c,c是一个函数,没有它,你括号就有问题,table(c(1,2)),每个括号给每个不同函数,各自配对。...这个函数并没有把这一串数值排序,他只是告诉你这一串数字的每一个值是排第几名,几个 match, merge, %in% 重难点,大家可以对它出题考核自己。...TCGA数据库count在做WGCNA时要log吗? 只有芯片数据差异分析的时候需要log,其他的均不需要。WGCNA推荐用cpm或tpm,counts只用于差异分析。...8老师们,有个奇怪的问题,我赋值i=-3,然后运行下面的代码,每次输出结果都是---,然后i的值会自动变为4,这是为啥? 因为你有个赋值语句呀,<-是赋值语句。...github R包本地安装。

    17410

    WGCNA分类性状处理

    以下是常规的分类变量处理原则: 如果是二分类,只要变为0/1即可(也可以变成1/2,没有影响),或者变成因子型;这里要特别指出,如果一个变量只有两个类别,比如normal和tumor这种,把这个变量变成两列的做法是错误的...(虽然很多文章中都这样用) 如果是有序多分类,比如治愈、好转、未愈,这种,可以变成数字1,2,3,或者变成因子型; 如果是无序多分类,那么此时需要使用WGCNA提供的函数进行处理。..."B" "C" "C" "C" 我们可以把它变成3组之间两两比较的形式,使用的是binarizeCategoricalVariable()函数: out 的性状数据都是包含在1个数据框中的,并且可能同时有多个分类变量,此时可以使用binarizeCategoricalColumns()。...的识别 WGCNA实战:识别免疫相关lncRNA 接下来就是计算模块(使用eigengenes代表)和性状(临床信息)之间的相关性和P值: # 计算模块的eigengenes,也就是第一主成分 MEs0

    48120

    表达量芯片的代码当然是可以移植到转录组测序数据分析

    acc=GSE135251&format=file 这个压缩包文件,并且解压在 GSE135251_RAW 文件夹里面: rm(list = ls()) ## 魔幻操作,一键清空~ options(stringsAsFactors...gset gset[[1]] a=gset[[1]] # phe=pData(a) # dat=exprs(a) #a现在是一个对象,取a这个对象通过看说明书知道要用exprs这个函数...以下是四种常见的NASH评分系统: NAFLD Activity Score (NAS) / NASH分数: 描述:NAS是一种常用于评估NASH严重程度的评分系统,它考察肝组织切片中的三个主要特征:脂肪变性...评分范围:通常从0到8,分数越高表示NASH的严重程度越高。 解释:NAS分数通常用于确定NASH的严重程度,分数≥5表示NASH,分数≥3表示NAFLD。...即使是抛开它这个无监督层次聚类的2分组不谈,它多次差异分析取交集来定位到25个基因,这样的操作也不可取,其实mfuzz或者wgcna更好,可以参考前面我们分享的代码:时间序列转录组多次差异分析以及时序分析

    25130

    WGCNA分类性状处理

    以下是常规的分类变量处理原则: 如果是二分类,只要变为0/1即可(也可以变成1/2,没有影响),或者变成因子型;这里要特别指出,如果一个变量只有两个类别,比如normal和tumor这种,把这个变量变成两列的做法是错误的...(虽然很多文章中都这样用) 如果是有序多分类,比如治愈、好转、未愈,这种,可以变成数字1,2,3,或者变成因子型; 如果是无序多分类,那么此时需要使用WGCNA提供的函数进行处理。..."B" "C" "C" "C" 我们可以把它变成3组之间两两比较的形式,使用的是binarizeCategoricalVariable()函数: out 的性状数据都是包含在1个数据框中的,并且可能同时有多个分类变量,此时可以使用binarizeCategoricalColumns()。...的识别 WGCNA实战:识别免疫相关lncRNA 接下来就是计算模块(使用eigengenes代表)和性状(临床信息)之间的相关性和P值: # 计算模块的eigengenes,也就是第一主成分 MEs0

    32240

    终结谷歌每小时20美元的AutoML!开源的AutoKeras了解下

    贝叶斯优化已被广泛用于基于观察有限数据的寻找函数最优值过程。它经常被用于寻找黑箱函数的最优点,其中函数的观察值很难获取。...传统的类牛顿或基于梯度的方法不能简单地进行应用。第三,网络态射运算改变神经架构的的一个层可能会导致其它层的很多变化,以保持输入和输出的一致性,这在以前的研究中并没有定义。...众所周知,贝叶斯优化已经广泛应用于优化基于有限观察值的目标函数,这激励我们探索利用贝叶斯优化加速变形运算选择过程。...由于架构包含的层级数和参数数量并不确定,因此向量化所有神经架构是不切实际的。此外,因为高斯过程是一种核方法,所以研究人员使用神经网络核函数以解决 NAS 搜索空间的问题,而不是直接向量化神经架构。...我们的方法在所有数据集上的错误率最低。 ? 表 1:分类错误率 ?

    99720

    WGCNA-最短教程掌握高级分析

    上期【高阶】WGCNA共表达网络分析-让你的文章闪耀起来中,我们给大家讲解了WGCNA的基本理论和其中的一些基本的概念,很多同学已经迫不及待想要学习整个WGCNA的分析流程了。...所以,在精简之后分为以下几个步骤: 01 数据预处理 这部分内容包括以下部分: 读取和过滤基因表达数据 读取样本表型数据 可视化样本聚类和表型数据 官方的示例数据是一个小鼠的芯片表达谱数据,包含了135...对于基因的表达量数据,需要进行过滤,对于基因而言,可以过滤缺失值或者低表达的基因,对于样本而言,如果该样本中基因缺失值很多,也需要过滤,WGCNA内置了一个检验基因和样本的函数,通过该函数可以进行一个基本过滤...表型数据中也包含了不需要的列,而且其样本比表达谱的样本多,需要根据表达谱的样本提取对应的表型数据。表达谱数据和表型数据准备好之后,可以绘制样本聚类树和表型的热图,生成的图片如下。 ?...上方为基因的聚类树,聚类时的距离为1-TOM值,下方为基因对应的modules。在WGCNA中,module的概念我们已经讲过了,其实就可以理解成是一个gene group的意思。

    3.6K22

    高颜值的Python版WGCNA分析和蛋白质相互作用PPI分析教程

    但Python中完成WGCNA分析相关的包仍是空白。我们根据WGCNA的原理,从底层上复现了原版WGCNA算法。...右侧垂直坐标为平均连通度,随 β 值的增加而减小。将这两个图结合起来,通常选择 r^2首次达到0.8或0.9或更高时的 β 值。利用 β 值,我们可以根据方程将相关矩阵转换成邻接矩阵。...sub_G=gene_wgcna.get_sub_network([6,12],correlation_threshold=0.95) pyWGCNA 提供了一个简单的可视化函数 plot_sub_network...ov.bulk.string_interaction(gene_list,4932) G_res.head() 蛋白相互作用预测结果 蛋白质相互作用网络分析 当然,omicverse还有非常漂亮的可视化函数...ppi.plot_network() 蛋白质相互作用网络 我们还可以使用ppi.G来获取蛋白质相互作用网络,该变量的格式为networkx,感兴趣的读者可以自行研究networkx包的相关分析。

    1.5K10
    领券