首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

在Wilcoxon Rank之后使用R中的Benjamini-Hochberg错误发现率时出错

可能是由于以下原因之一:

  1. 数据不满足假设条件:Wilcoxon Rank检验要求数据满足独立同分布的假设,如果数据不满足这个假设,可能会导致错误的结果。在使用Wilcoxon Rank之前,可以检查数据是否满足这个假设,如果不满足,可以考虑使用其他适合的非参数检验方法。
  2. 数据处理错误:在进行Wilcoxon Rank检验之后,可能在使用Benjamini-Hochberg错误发现率时出现了数据处理错误。在使用Benjamini-Hochberg方法时,需要按照正确的步骤进行调整,包括计算p值、排序、计算调整后的p值等。如果在这个过程中出现错误,可能会导致结果不正确。
  3. R代码错误:在使用R进行数据分析时,可能存在代码错误导致结果出错。在使用Wilcoxon Rank和Benjamini-Hochberg方法时,需要确保使用正确的函数和参数,并按照正确的顺序进行调用。可以检查代码是否存在语法错误、函数调用错误或参数设置错误等问题。

为了解决这个问题,可以采取以下步骤:

  1. 检查数据是否满足Wilcoxon Rank检验的假设条件,如果不满足,考虑使用其他适合的非参数检验方法。
  2. 确保在使用Benjamini-Hochberg方法时按照正确的步骤进行调整,包括计算p值、排序、计算调整后的p值等。
  3. 仔细检查R代码,确保使用正确的函数和参数,并按照正确的顺序进行调用。

如果问题仍然存在,可以提供更具体的错误信息和相关代码,以便更好地帮助解决问题。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

识别差异微生物的方法汇总

多重假设检验校正:在分析过程中,Corncob 会对多重比较问题进行校正,以控制第一类错误率,常用的校正方法包括Benjamini-Hochberg (BH) 方法。...Wilcoxon秩和检验:在CLR转换之后,使用Wilcoxon秩和检验(一种非参数检验方法)来比较两组样本中不同物种的丰度是否存在显著差异。...多重检验校正:由于同时对多个物种进行Wilcoxon检验,需要使用多重检验校正方法(如Benjamini-Hochberg方法)来控制假发现率(FDR)。...Wilcoxon秩和检验:在稀释抽样之后,使用Wilcoxon秩和检验来比较两组样本中特定微生物分类单元的丰度是否存在显著差异。Wilcoxon检验是一种非参数检验,不需要数据符合正态分布的假设。...多重检验校正:由于同时对多个分类单元进行Wilcoxon检验,需要使用多重检验校正方法(如Benjamini-Hochberg方法)来控制假发现率(FDR)。

25110

单细胞Scanpy流程学习和整理(分析簇间差异基因细胞注释数据保存)

# 在单细胞数据中,根据不同的群体(在这个例子中是使用了 "leiden" 聚类得到的群体)进行差异表达基因的排名。# "leiden":指定了根据 leiden 聚类标签来区分细胞群体。...# sharey=False:表示在绘制多个基因的表达量分布图时,每个基因的 y 轴不共享,这样可以分别展示每个基因在不同群体中的表达差异。...# "rank_genes_groups" 是在 uns 中的一个键(key),通常用于存储通过 sc.tl.rank_genes_groups 计算的差异表达基因的结果。...# "names" 是在 rank_genes_groups 中的一个键,通常用于存储排名靠前的基因名(即在各个分组中最显著的基因)。.../output/test_none.h5ad")注:若对内容有疑惑或者有发现明确错误的朋友,请联系后台(欢迎交流)。更多内容可关注公众号:生信方舟 - END -

75510
  • 7.11-7.17 交流群问题汇总第4期

    3.LULU 发现之前文章一个错误: 在 不让人省心的LULU! 中,中间有句话写错了,更正如下: ? 4.数据分析的一个样本问题:所有样本一起分析还是分组分别分析?...在大部分情况下是median,但是在某些情况下的确不是median,比如两组样本median一样,但是wilcoxon test依然显著的例子也是存在的。...非参数检验本身基于rank,不需要自己去做rank。 虽然像类似wilcoxon test是基于rank的,但是生存分析的kaplan–meier就不是基于rank的非参数检验方法。...MENA做网络分析如何确定cutoff值 P值要都大于0.05的条件下,选择相同的cutoff。 判断网络好不好,可以看的R2。尽量不要小于0.7。...majority选大一点,cutoff别太低,基本上R2就不会低。

    71140

    睡眠时的局部目标记忆再激活

    (A)在每次实验中,同侧电极(粉色)和对侧电极(绿色)的学习任务的前三轮中,中央EEG ERP(n=30)时间锁定到单词呈现。阴影表示标准错误。...仅在TMR实验中,两个半球的纺锤波(12-16Hz)功率明显增加(图4B和4F:cued半球:Wilcoxon sign-rank=195,Z=2.576,p=0.01,effect size:RBCRBC-r...对照实验显示同样的结果(图4G;Wilcoxon sign-rank=47;Z=-1.932;p=0.053;effectsize:RBC r=-0.505)。...本文发现纺锤波功率升高存在显著性相互作用(Z=-2.248;ranked-sum=293;p=0.025;Wilcoxon rank-sum test;使用Wilcoxon rank-sum test在...使用Spearman相关来测试SW功率和记忆改善间的相关性,使用单尾Fisher r-to-Z变换检验相关性间的差异。使用聚类校正的跨时频bins的非参数置换检验探究半球间的振荡功率差异。

    64620

    Python 做 Nature 级的单细胞分析(图文详解)

    作为变量名 cache=True) # 写入缓存,可以更快的读取文件 2 预处理 显示在所有细胞中在每个单细胞中产生最高计数分数的基因...sharey=False) Wilcoxon rank-sum Wilcoxon rank-sum (Mann-Whitney-U) 检验的结果非常相似,还可以使用其他的差异分析包,如 MAST、limma...al. (2018),这里使用多变量方法,而传统的差异测试是单变量 Clark et al. (2014) 除了仅由 t 检验发现的 IL7R 和由其他两种方法发现的 FCER1A 之外,所有标记基因都在所有方法中都得到了重现.../write/pbmc3k_corrected_X_pca.csv') 8 番外 大家在处理较多数据量的时候,根据不同的样本会有些地方不一样,具体每个数据集的处理也会有比较大的自由度,比如: 在质控时,...在做 UMAP 时,可以看到一些类群间的联系和轨迹,如果细胞类群间有时间序列,最好使用该方法。 做 TSNE时,可以看到类群间比较干净,如果查看类群区别可以用该方法。

    7.4K43

    外泌体多组学03-scMappR包(1):制造signature matrix

    (bulk RNA-seq)完成时,确定基因表达的变化在多大程度上是由于细胞类型比例的变化往往是一个挑战。...这一挑战可以通过单细胞RNA-seq(scRNA-seq)方法来解决,该方法在单细胞分辨率下测量基因表达,利用scRNA-seq从bulk RNA-seq中了解细胞类型比例(RNA-seq反褶积)。...文章中主要使用scMappR构建了一个cell-type signature matrix,然后使用CIBERSORT:(https://cibersortx.stanford.edu/) 进行尿液外泌体的细胞类型溯源..../") # 探索一下数据结果 str(tst1) tst1$wilcoxon_rank_mat_t[1:4,1:4] tst1$wilcoxon_rank_mat_or[1:4,1:4] str(tst1...:数据框,为signature matrix的ranks值,rank值为(-log10(Padj) * sign(fold-change)) wilcoxon_rank_mat_or:数据框,signature

    73820

    7.4-7.10 交流群问题汇总第3期

    答3.4:确定性和随机性过程在群落构建过程中本身可能就容易混淆,vellend在生态群落理论中把群落构建的高层级过程总结为咱们现在常见的选择、扩散、漂变、成种(多样化),他提出随机性是考虑物种自身特性后仍然发生随机情况...答1:wilcoxon test是基于rank的检验,担心的就是因为只有0-5的数据范围,可能出现II类错误会比较大。...wilcoxon是非参数检验,比起参数检验检,对数据分布假设的要求没那么高,但是II类错误的概率会大一些,但是wilcoxon本身第一步需要对样本数据进行排序,0-5的范围,排序可能排不开,都堆在一起了...II类错误意思是, 如果用wilcoxon test算出来是显著,那可以说显著。如果用wilcoxon test算出来不显著,那可能是II类错误大造成的,可以再试试GLM看显不显著。...中性模型r2负值? 不是很清楚。我还见过迁移率m大于1的。 16. 跑R电脑内存不足? gc()清理一下内存;把不用的对象rm()掉,如果还不行就没办法了。 17.

    1.3K40

    老瓶新装:TCGA+GEO分子分型发5+分

    作者使用了随机NMF算法来探究MSI-H STAD是否能被聚类以及能被聚类时的最佳聚类数,如图1A,为选择最佳的factorization rank r,作者将r分别设为2-6的整数并分别运行了NMF,...表1:两个数据集MSI-H1和MSI-H2差异分析 3.MSI-H1与MSI-H2亚组的预后研究 为了探寻MSI-H1与MSI-H2亚组在预后层面可能存在的差异,作者使用KM法和Log-rank...另外,作者还比较了MSI-H1/2和研究背景提到的文章中预后较差的MSS组之间生存率的差异,发现MSI-H2亚组的患者生存率明显高于MSS组(DFS:p=0.01;OS:p=0.0038),但MSI-H1...而IDO1作为癌症治疗中有希望的免疫治疗靶点,在MSI-H1亚组中的表达水平比MSI-H2亚组中高得多((five-fold higher,p=1.761e-06,Wilcoxon检验)。 ?...图4C:MSI-H1与MSI-H2 CCLs表达的差异分析 在MSI-H1亚组中,使用网页工具CIBERSORT推断的TAM浸润程度显著高于MSI-H2亚组(p=0.007,Wilcoxon

    1.9K31

    单细胞分析的 Python 包 Scanpy(图文详解)

    作为变量名 cache=True) # 写入缓存,可以更快的读取文件 2、预处理 显示在所有细胞中在每个单细胞中产生最高计数分数的基因 sc.pl.highest_expr_genes...Wilcoxon rank-sum Wilcoxon rank-sum (Mann-Whitney-U) 检验的结果非常相似,还可以使用其他的差异分析包,如 MAST、limma、DESeq2 和 diffxpy...除了仅由 t 检验发现的 IL7R 和由其他两种方法发现的 FCER1A 之外,所有标记基因都在所有方法中都得到了重现。...Wilcoxon Rank-Sum 测试结果重新加载已保存的对象 adata = sc.read(results_file) 获取聚类分组和分数 result = adata.uns['rank_genes_groups.../write/pbmc3k_corrected_X_pca.csv') 8、番外 我之前在处理较多数据量的时候,会有些地方不一样,具体每个数据集的处理也会有比较大的自由度,比如: 在检测线粒体基因时,这里在质控时

    5.2K41

    单细胞测序最好的教程(六):细胞类型注释

    因此,我们第一步注释的聚类分辨率不用太高,使用默认的resolution=1即可。...我们将循环遍历所有marker字典里的细胞类型,并仅保留我们在adata对象中发现的基因作为该细胞类型的标记基因。这将在我们开始绘图时防止错误的发生。...答案是肯定的,在这里,我们将使用AUCell来评估每一类细胞的marker基因,在我们的每一个簇中的富集情况,我们首先将数据还原成raw格式,因为我们需要所有的基因。...我们发现,Others细胞主要位于原来的簇2与簇5,但是由于分辨率的限制,我们认为Others细胞也属于簇2与簇5,更进一步的,我们可以使用umap图可视化簇2与簇5的marker基因来帮助我们确认Others...思考 本章是单细胞数据分析中最重要的内容,细胞类型注释,我们后续的所有分析,都要基于正确的细胞类型进行。如果细胞类型注释错误,这对我们下游的分析结果而言,会导致全部出错。

    3.7K22

    单细胞测序最好的教程(六):细胞类型注释

    因此,我们第一步注释的聚类分辨率不用太高,使用默认的resolution=1即可。...我们将循环遍历所有marker字典里的细胞类型,并仅保留我们在adata对象中发现的基因作为该细胞类型的标记基因。这将在我们开始绘图时防止错误的发生。...答案是肯定的,在这里,我们将使用AUCell来评估每一类细胞的marker基因,在我们的每一个簇中的富集情况,我们首先将数据还原成raw格式,因为我们需要所有的基因。...我们发现,Others细胞主要位于原来的簇2与簇5,但是由于分辨率的限制,我们认为Others细胞也属于簇2与簇5,更进一步的,我们可以使用umap图可视化簇2与簇5的marker基因来帮助我们确认Others...思考 本章是单细胞数据分析中最重要的内容,细胞类型注释,我们后续的所有分析,都要基于正确的细胞类型进行。如果细胞类型注释错误,这对我们下游的分析结果而言,会导致全部出错。

    1.5K11

    scanpy教程:预处理与聚类

    其实它的许多分析思路借鉴了以seurat为中心的R语言单细胞转录数据分析生态的,scanpy以一己之力在python生态构建了单细胞转录组数据分析框架。...在Windows、mac、linux平台scanpy都是可以运行的。 在学习新的库时,文档是不可不看的。有统计表明,程序员读代码的时间一般三倍于写代码的时间。所以这基本上是一次阅读体验。...所以,这张表.X的对象cell相关的信息记录在.obs中,属性gene的信息记录在.var中,其他的信息在.uns中。那么每一部分是什么呢?...在特征提取之前要保证细胞之间是有可比性的,一般用的是归一化的方法,得到高变基因之后,为了使同一个基因在不同细胞之间具有可比性采用标准化。...,我们发现不管工具如何变,单细胞转录组的数据分析的大框架是没有变化的,几个分析的工具也是相互借鉴的。

    14.9K2721

    推荐系统遇上深度学习(九)--评价指标AUC原理及实践

    如果将CTR预估问题当作回归问题,我们经常使用的损失函数是MSE;如果当作二分类问题,我们经常使用的损失函数是LogLoss。...可以看到,TP和TN是我们预测准确的样本,而FP和FN为我们预测错误的样本。...精确率表示预测结果中,预测为正样本的样本中,正确预测为正样本的概率; 召回率表示在原始样本的正样本中,最后被正确预测为正样本的概率; 二者用混淆矩阵计算如下: ? 精确率和召回率往往是一对矛盾的指标。...相反,当阈值很低时,分类器把很多拿不准的样本都预测为了正样本,此时召回率很高,但是精确率却往往偏低。...具体操作就是再把所有这些score相等的样本 的rank取平均。然后再使用上述公式。此公式描述如下: ?

    1.4K10

    R语言系列第四期:①R语言单样本双样本差异性检验

    t = -2.8203, df = 10, p-value = 0.01815 结果显示中t=-2.8203是统计量,df代表自由度,p-value是最终的p值,p=0.01815在检验水准在...Wilcoxon符号秩和检验(单样本) t检验在数据来自正态分布时比较稳定,在不满足正态分布的数据也不错,尤其是大样本条件下,把握度相对较高。...我们只要传递一个模型方程,就能通过R中的t.test和wilcox.test来分析这样格式的数据。...所以可以使用常规的t检验来比较。 #Tips:方差齐性检验不能用在配对的数据中,只能用在独立的两组数据上。 E....两样本Wilcoxon检验 使用wilcoxon检验和t.test相似: > wilcox.test(expend~stature) Wilcoxon rank sum test with continuity

    1.8K10

    R语言系列第四期:①R语言单样本双样本差异性检验

    t = -2.8203, df = 10, p-value = 0.01815 结果显示中t=-2.8203是统计量,df代表自由度,p-value是最终的p值,p=0.01815在检验水准在...Wilcoxon符号秩和检验(单样本) t检验在数据来自正态分布时比较稳定,在不满足正态分布的数据也不错,尤其是大样本条件下,把握度相对较高。...我们只要传递一个模型方程,就能通过R中的t.test和wilcox.test来分析这样格式的数据。...所以可以使用常规的t检验来比较。 #Tips:方差齐性检验不能用在配对的数据中,只能用在独立的两组数据上。 E....两样本Wilcoxon检验 使用wilcoxon检验和t.test相似: > wilcox.test(expend~stature) Wilcoxon rank sum test with continuity

    2.1K10

    系统比较Seurat和scanpy版本之间、软件之间的分析差异

    图(s)也用于进一步的非线性降维,使用t-SNE或UMAP在二维中图形化地描绘这些数据结构。...然而,在软件或版本之间观察到相当大的可变性,即使在执行其他类似或看似相同的分析时也是如此。...使用默认设置的聚类也会导致输出的差异,即使在调整函数参数和输入SNN图时,Seurat和Scanpy也证明了Louvain聚类的差异,但在Leiden算法的实现中是相同的。...然而,由于在Seurat /presto的Wilcoxon秩和计算中缺乏切换校正的能力,这些差异无法与类似scanpy的函数参数相协调。...总结Seurat和Scanpy在使用默认设置执行分析的方式上存在相当大的差异,这些差异只能通过调整函数参数来部分调和。这些差异相当于当降采样读数小于5%或降采样细胞小于20%时引入的可变性。

    36820

    Scanpy进行单细胞分析及发育轨迹推断

    最近看文献,发现越来越多的单细胞测序使用scanpy进行轨迹推断,可能因为scanpy可以在整体umap或者Tsne基础上绘制细胞发育路径,图片也更加美观,但是Scanpy是基于python开发的,下面整理下...推荐大家使用anaconda中的jupyter进行相关分析,非常便于数据的复现以及随时矫正~ 在jupyter使用pip install scanpy 完成scanpy安装。...使用leiden进行聚类 别忘记提前在python上安装相关算法 ?...64位.这意味着float64占用了两倍的内存 – 在某些机器架构中对它们进行操作可能会慢得多,但是,float64可以比32位浮点数更准确地表示数字,它们还允许存储更大的数字。...到目前已经完成了初步的分析,由于scanpy是建立在python基础上,事实上在使用中速度比R要快特别多~

    4K20

    Microbiome: 标准化和微生物差异丰度策略取决于数据特征

    模拟研究表明,许多差异丰度测试方法的错误发现率并没有因为稀释而增加,尽管稀释会由于部分可用数据的消除而导致灵敏度的损失。 对于平均库大小差异较大(~10×)的组,稀释降低了错误发现率。...DESeq2在较小数据集(的灵敏度增加,但随着样本的增加、库的不均匀度(~10×)和组成效应,趋向于更高的错误发现率。...为了推断生态系统中的分类单元丰度,analysis of composition of microbiomes (ANCOM)是唯一一种能够很好地控制错误发现率的方法。...在DESeq2的对数转换之前,手动向矩阵添加伪数值的做法会增加FDR。这与之前的研究结果一致,即RNA-Seq方法不适合微生物组数据。 如果每个组的平均库大小大致相等,那么稀释本身不会增加错误发现率。...对于组间平均库大小差异较大(~10×)的组,稀释有助于降低错误发现率。 在分析之前,研究人员应该评估各组之间平均文库大小的差异。

    2.6K21

    组间差异分析:Metastats

    在不同区组中寻找差异物种常用的两个工具是Metastats和LEfSe。...当我们明白了他们的原理,实际上可以不用拘泥于两个工具本身,可以自己在R中选择合适的方法来进行分析。 p值校正 假设检验是一种概率判断,因为小概率事件发生了所以我们拒绝假设。...然而同时多次做这种概率判断,也会出错。例如当我们进行多重独立比较相关性时,假如有k个变量,那么需要进行n=k(k-1)/2个相关性分析,每个相关性均检验一次。...在R中p值校正可以使用p.adjust()函数,其使用方法如下所示: p.adjust(p, method=p.adjust.methods, n=length(p)) 其中p为显著性检验的结果(为数值向量...校正后的p值常称为q值,使用Benjamini-Hochberg(BH)方法校正的p值也称为错误发现率(false discovery rate,FDR)。

    1.5K10
    领券