中位数的函数类似于"which.max"和"which.min"/从data.frame中提取中值行 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

R语言常见函数知识点梳理与解析 | 精选分析

目录 1、str() 显示数据集和变量类型，并简要展示数据集情况 2、subset() 取子集 3、which.min(), which.max()和which() 4、pmin( )/ pmax(.../向量 9、unique（）返回 x 但是省去重复的数值 10、round（），floor（）和ceiling（） 11、sign（）符号函数 12、%in% 检验x是否为集合y中的元素（x%in%y...#……省略部分内容 3、which.min(), which.max()和which() which(), which.max(), which.min()返回的是位置（索引） which(x, arr.ind...[1] 2 4 5 7 8 9 > which.min(x) #显示min(x)的所有数值的位置 [1] 3 > which.max(x) #显示max(x)的所有数值的位置 [1] 4 > plot...：把列合并为矩阵 rbind：把行合并为矩阵 diag：矩阵对角元素向量或生成对角矩阵 aperm：数组转置 nrow, ncol：计算数组的行数和列数 dim：对象的维向量 dimnames：对象的维名

2.3K2 1

dataframe进行常用统计、分组统计平均绝对偏差等操作函数。

pandas在dataframe中提供了丰富的统计、合并、分组、缺失值等操作函数。...1.统计函数 df.count() #非空元素计算 df.min() #最小值 df.max() #最大值 df.idxmin() #最小值的位置，类似于R中的which.min函数 df.idxmax...() #最大值的位置，类似于R中的which.max函数 df.quantile(0.1) #10%分位数 df.sum() #求和 df.mean() #均值 df.median()...#中位数 df.mode() #众数 df.var() #方差 df.std() #标准差 df.mad() #平均绝对偏差 df.skew() #偏度 df.kurt() #峰度...对应的部分数据描述 ?

3.6K6 0

您找到你想要的搜索结果了吗？

是的

没有找到

R语言-因子和表

因子和表因子（factor）是R语言中许多强大运算的基础，因子的设计思想来着统计学中的名义变量（分类变量），因子可以简单的看做一个附加了更多信息的向量。...，求连乘factorial（）函数，求阶乘max（）函数，求最大值，min（）函数，求最小值，range（）函数，同时返回最小值与最大值which.max（）函数返回最大元素的位置，which.min（...）函数返回最小元素的位置median（）函数，求中位数var（）函数，计算方差rev（）函数，对元素去逆序列sort（）函数，将元素按升序排列，order（）函数，从小的到大的返回他们各自的位置cumsum...（）函数，累计和，第n个元素是1加到n的和pmax（a，b）函数返回一个向量，第i个元素是ai与bi中的最大值、pmin（a，b）函数返回一个向量，第i个元素是ai与bi中的最小值match（x，y）函数...，返回一个和x的长度相同的向量，表示x中与y中元素相同的元素在y中的位置（没有则返回NA）choose（n,k），求组合数，从n个中选出Kunique（x），如果x是一个向量或数据框，则返回一个类似的对象但是去掉所有重复的元素

791 0

R语言数据集合并、数据增减、不等长合并

数据选取与简单操作： which 返回一个向量中指定元素的索引 which.max 返回最大元素的索引 which.min 返回最小元素的索引 sample 随机在向量中抽取元素 subset 根据条件选取元素...(b, collapse = ",") #不同向量合并在一起，但是变成一个向量 mode(b) #变量类型 mode(c) 4、cbind和rbind函数 cbind()和rbind...rbind()按照横向的方向，或者说按行的方式将矩阵连接到一起 rbind/cbind对数据合并的要求比较严格：合并的变量名必须一致；数据等长；指标顺序必须一致。...#do.call函数在数据框中执行函数（函数，数据列） library("plyr") #加载获取rbind.fill函数 #第一种方法 list1<-list() list1[[1]]=data.frame...(Job_Pwordseg.ct[2])))) 核心函数是plyr包中的rbind.fill函数（合并的数据，必须是data.frame），do.call可以用来批量执行。

13.3K1 2

基于Python数据分析之pandas统计分析

d1.count() #非空元素计算 d1.min() #最小值 d1.max() #最大值 d1.idxmin() #最小值的位置，类似于R中的which.min函数 d1.idxmax...() #最大值的位置，类似于R中的which.max函数 d1.quantile(0.1) #10%分位数 d1.sum() #求和 d1.mean() #均值 d1.median() #中位数...在实际的工作中，我们可能需要处理的是一系列的数值型数据框，如何将这个函数应用到数据框中的每一列呢？可以使用apply函数，这个非常类似于R中的apply的应用方法。...常用的有三大类方法，即删除法、填补法和插值法。删除法当数据中的某个变量大部分值都是缺失值，可以考虑删除改变量；当缺失值是随机分布的，且缺失的数量并不是很多是，也可以删除这些缺失的观测。...其中参数frac是要返回的比例，比如df中有10行数据，我只想返回其中的30%,那么frac=0.3。有时候，我们可能需要打混后数据集的index（索引）还是按照正常的排序。

3.3K2 0

R语言向量与矩阵

<- c(1:100) # 查看向量x1的内容 > x1 [1] 2 4 6 8 0 # 查看向量x1中的第三个数 > x1[3] [1] 6 2、查看向量的长度和类型 # 查看字符串向量...45 47 49 # 向量a中前三个元素相加 > a[a[3]] [1] 21 2、Seq()函数 Seq()函数可以按照指定的规律创建向量 # 创建一个从5到20的向量 > seq(5,20...> a <- c(2,3,4,2,5,1,6,3,2,5,8,5,7,3) # 向量中最大值的下标 > which.max(a) [1] 11 # 向量中最小值的下标 > which.min(a)...[1] 6 # 最小下标的值 > a[which.min(a)] [1] 1 # 向量中值为2的下标 > which(a==2) [1] 1 4 9 # 向量中为2的元素 > a[which(a...()函数 > a1 <- c(1:12) # 创建一个三行四列的矩阵 > matrix(a1,3,4) [,1] [,2] [,3] [,4] [1,] 1 4 7

1.4K2 0

R语言入门系列之一

R语言通过函数（function）来提取对象属性、变量运算，函数可以来自R平台，也可以来自各种软件包（package）、自定义函数。 R语言不用事先声明对象或变量，对象在赋值时同步创建。...sinmin()返回最小值，此外which.min()返回最小值idmax()返回最大值，此外which.max()返回最小值idabs()返回数值对象绝对值sum()返回对象元素的和prod()返回对象元素的乘积...类别（名义型）变量和有序变量在R中称为因子（factor）。...#为每个对象命名举例如下：列表的索引可以使用双括号[[]]加编号或者名字，也可以使用$加名字提取，如下所示：列表是一种简单的数据组织和调用方式，很多函数的计算结果也是列表（例如lapply()...⑵从带分隔符的文本文件导入数据函数read.table()可以从带分隔符的文本文件导入数据，此函数读入一个表格格式的文件并保存为数据框，使用方法如下： read.table("file", header

4.1K3 0

新版TCGAbiolinks包学习：表达矩阵提取（mRNAlncRNAcountstpmfpkm）

因为里面直接包含了表达矩阵、样本信息、基因信息，可以非常方便的通过内置函数直接提取想要的数据，再也不用手扒了！!...这个对象的结构是这样的：是不是感觉和单细胞的SingCellExperiment对象非常像~ SingCellExperiment 上次我们下载了常见的组学数据，今天学习下怎么提取数据，就以TCGA-READ...分别提取mRNA和lncRNA的表达矩阵，还要添加gene symbol的那种！加载数据和R包加载之前下载好的数据。...，就像对数据框取子集那样，选择符合条件的行和列，并且子集也是SummarizedExperiment对象！...添加gene_symbol 添加gene_symbol也就非常简单了，只要提取gene_name这一列，然后和原来的表达矩阵合并即可！

2.2K5 0

最优子集回归算法详解

01 模型简介最优子集回归是多元线性回归方程的自变量选择的一类方法。从全部自变量所有可能的自变量组合的子集回归方程中挑选最优者。...，可以直观看出共线性：每个格子中椭圆面积越小，表示相关性越强。...(best.summary$cp)#马洛斯Cp值 which.max(best.summary$adjr2) #调整R2 which.min(best.summary$bic) #贝叶斯信息准则执行最优子集回归后返回的是自变量组合的子集回归方程...，以及每个回归方程对应的评价指标,采用which函数选取最优的回归方程。...可做图观察，图横坐标为自变量，纵坐标是调整R2，且最上面的变量搭建的回归方程的调整R2是最大的，同时利用coef()可以查看最优回归方程的回归系数，结合来看变量APSLAKE、OPRC和OPSLAKE是筛选出来的变量

4K5 1

R语言入门 Chapter01 | 向量

R中的向量概念与数学之间的向量是不同的，类似于数学上的集合的概念，由一个或多个元素所构成。向量其实是用于存储数值型、字符型或逻辑型数据的一维数组。用函数C来创建向量。...其中R内置的函数中，格式为为向量的有： euro rivers stat.abb state.name state.area 2、创建向量和查看向量 1、创建向量 1、创建向量：c()，...45 47 49 # 向量a中前三个元素相加 > a[a[3]] [1] 21 2、Seq()函数 Seq()函数可以按照指定的规律创建向量 # 创建一个从5到20的向量 > seq(5,20...> a <- c(2,3,4,2,5,1,6,3,2,5,8,5,7,3) # 最大值的位置 > which.max(a) [1] 11 # 最小值的位置 > which.min(a) [1] 6...# 最小下标的值 > a[which.min(a)] [1] 1 # 向量中值为2的下标 > which(a==2) [1] 1 4 9 # 向量中2所在的位置 > a[which(a==2)]

1.1K2 0

灰太狼的数据世界（三）

关于dataframe中的统计函数，这里就不多说什么了，具体已经在Serires那个章节中列详细出来了。具体可以参考以下方法。...df.count（）＃非空元素计算 df.min（）＃最小值 df.max（）＃最大值 df.idxmin（）＃最小值的位置，类似于R中的which.min函数 df.idxmax（）＃最大值的位置，类似于...R中的which.max函数 df.quantile（0.1）＃10％分位数 df.sum（）＃求和 df.mean（）＃均值 df.median（）＃中位数 df.mode（）＃众数 df.var（）...apply函数可以对DataFrame对象进行操作，既可以作用于一行或者一列的元素，也可以作用于单个元素。apply最神奇的地方就是它里面可以调用函数，我们经常在apply里面写一些功能的匿名函数。...从上面例子的结果中我们看出数据里面的所有数字都被乘上了2，这就因为我们的apply函数里面写了一个匿名函数，将原来的数据变成两倍（如果你对lambda不懂，可以参考之前文章，介绍python里面的高级函数的

2.8K3 0

R语言统计知识以及常用方法实例

trim - 用于从排序的向量的两端删除一些观测值。 na.rm - 用于从输入向量中删除缺少的值。...median(x,na.rm=FALSE) x - 是输入向量 na.rm - 是用于输入向量中删除缺少的值。...不同于平均值和中位数，众数可以同时具有数字和字符数据。...,data) ormula - 即：y ~ x1+x2+x3...是呈现响应变量和预测变量之间关系的符号。 data - 是应用公式的向量。...该包中含有Surv()函数，它将输入数据作为R公式，并在所选变量中创建一个生存对象进行分析。然后使用survfit()函数来创建分析图。

6321 0

多组差异表达分析火山图合并绘制

0 447 4.636853e-11 Down ACC 0 469 8.875275e-05 Up ACC 0 计算每组差异分析中logFC...的最大值和最小值 minlogfc = alldeg2 %>% group_by(cancer) %>% dplyr::slice(which.min(logFC)) maxlogfc = alldeg2...%>% group_by(cancer) %>% dplyr::slice(which.max(logFC)) 根据分组个数，定义用来绘图的数据。...dfbar0 <- data.frame(x=c(0:3), y= maxlogfc$logFC ) dfbar1<- data.frame(x=c(0:3),...，频率为4的基因就是共同的差异表达基因。

1.2K2 0

GEO数据挖掘7

, which.min ## Loading required package: Biobase ## Welcome to Bioconductor ## ## Vignettes contain...' ## The following object is masked from 'package:clusterProfiler': ## ## select ## # 主要输入文件为表达量的矩阵和基因集的文件...### 对 MigDB中的全部基因集做GSVA分析。...paste0(unique(group_list),collapse = "-"), levels = design) # 差异比较的函数...绘制差异热图 library(pheatmap) lapply(1:length(es_deg), function(i){ dat=es_max[[i]] df=es_deg[[i]] # 提取有意义的绘图

1.4K3 0

多组差异表达分析的可视化

0 447 4.636853e-11 Down ACC 0 469 8.875275e-05 Up ACC 0 计算每组差异分析中logFC...的最大值和最小值 minlogfc = alldeg2 %>% group_by(cancer) %>% dplyr::slice(which.min(logFC)) maxlogfc = alldeg2...%>% group_by(cancer) %>% dplyr::slice(which.max(logFC)) 根据分组个数，定义用来绘图的数据。...dfbar0 <- data.frame(x=c(0:3), y= maxlogfc$logFC ) dfbar1<- data.frame(x=c(0:3),...，频率为4的基因就是共同的差异表达基因。

3992 0

ggplot2可视化拷贝数变异CNV的GISTIC score

，纵坐标是G-Score，红色表示扩增，蓝色表示删失，如果要用ggplot2画这个图，那我们也要有这个数据才行！...在GISTIC2.0的输出结果中，有一个scores.gistic的文件，我们可以用VScode打开看看：看看它的列名，真是太巧了，竟然和我们需要的数据非常相似，有gistic score，也有染色体位置...通过半天的学习，我知道了BSgenome这个东西，还知道了人类的全基因组序列包BSgenome.Hsapiens.UCSC.hg38，这里面就有各个基因组的位置和长度信息。...然后再继续学习下就知道BSgenome也是一个对象，可以通过特定函数提取信息。 OK，下面就开始提取信息了！...然后就是计算从0开始的每条染色体位置坐标，就是简单的线段长度加减法，不过对于我这种好久不搞数学的人来说也是很费脑子的！

2.3K6 0

【学习】笨办法学R编程（三）

看到各位对“笨办法系列”的东西还比较感兴趣，我也很乐意继续写下去。今天的示例将会用到数据框（data.frame）这种数据类型，并学习如何组合计算两个向量，以及如何排序。...回文数是指一个像1534351这样“对称”的数，如果将这个数的数字按相反的顺序重新排列后，所得到的数和原来的数一样。开始啦！...(x) x[which.min(x)] x[order(x)] y <- 1:10 data <- data.frame(x,y) class(data) head(data) data[1,] data...[,1] data$x data[order(data$x),] # Project Euler 4 # 在两个三位数字的乘积中，找出最大的回文数 # 先建立一个将数字顺序进行反转的函数 reverse...如果不用expand.grid函数的话，可以利用嵌套for来组合计算。另外还有一种作法是利用R本身的rev函数，先将数字转为字符，再切开成一串向量，用rev反转后判断。

1.2K5 0

分组计算描述性统计量函数—by()函数

将以上学徒信息构建成数据框，存到biotrainee变量名中： biotrainee <- data.frame(name = c('xg','xj','hj','wh','xs'),...在list上逐个元素调用FUN函数。可以用于data.frame上，因为data.frame是一种特殊形式的list。...到这里by()函数的用法就讲完了，只讲基本用法，不讲在实际数据分析过程中能解决什么问题？...在id转换过程中，经过一系列处理我们得到了ids，它与我们提取的表达矩阵exp的探针顺序一一对应： > head(ids) probe_id symbol 1 7896759 LINC01128...第三个参数是我们自己定义的函数：计算每个小矩阵中每行探针表达量的平均值（也就是每个探针在6个样本中表达量的均值rowMeans(x)），再取平均值最大的那个探针作为该symbol所对应的唯一探针which.max

1.1K2 1

R语言函数

1.初级统计（R_01） x<-(1,2,3,4,5,6) max(x) #最大值 min(x) #最小值 mean(x) #均值 median(x) #中位数 range(x)#返回最小值和最大值 var...trunc()#返回整数部分 which.max(c(1,2,3,5,6))#返回最大值所在位置，5 2.有重复的用rep(),有规律的序列用seq(),随机数用rnorm() rep("x",times...%in% x %in% y #x的每个元素在y中存在吗 y %in% x #y的每个元素在x中存在吗 #取交集intersect会去重复，而%in%不会 6.向量筛选(取子集)——[] x <- 8:12...#x[x<-2]改为x[x< -2],注意区分赋值号和小于-2 ####修改向量中的某个/某些元素：取子集+赋值 x #改一个元素 x[4] <- 40#将x中的第4个值改为40 #改多个元素 x...为2表示列，FUN是函数 test<- iris[1:6,1:4] apply(test, 2, mean)#求test所有列的平均值 apply(test, 1, sum)#求test所有行的和 7.2

2312 0

python数据分析——数据的选择和运算

它们能够帮助我们从海量的数据中提取出有价值的信息，并通过适当的运算处理，得出有指导意义的结论。数据的选择，是指在原始数据集中筛选出符合特定条件的数据子集。这通常涉及到对数据的筛选、排序和分组等操作。...综上所述，Python在数据分析中的数据选择和运算方面展现出了强大的能力。通过合理的数据选择和恰当的运算处理，我们可以从数据中获取到宝贵的信息和洞见，为决策提供有力的支持。...关键技术：多维数组中对行的选择，使用[ ]运算符只对行号选择即可，具体程序代码如下所示：花式索引与布尔值索引 ①布尔索引我们可以通过一个布尔数组来索引目标数组，以此找出与布尔数组中值为True...merge()是Python最常用的函数之一,类似于Excel中的vlookup函数,它的作用是可以根据一个或多个键将不同的数据集链接起来。...关键技术: mean()函数能够对对数据的元素求算术平均值并返回,程序代码如下所示: 中位数运算 中位数又叫作中值,按顺序排列的一组数据中位于中间位置的数,其不受异常值的影响。

1621 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭