首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言 常见函数知识点梳理与解析 | 精选分析

目 录 1、str() 显示数据集变量类型,并简要展示数据集情况 2、subset() 取子集 3、which.min(), which.max()which() 4、pmin( )/ pmax(.../向量 9、unique()返回 x 但是省去重复数值 10、round(),floor()ceiling() 11、sign() 符号函数 12、%in% 检验x是否为集合y元素(x%in%y...#……省略部分内容 3、which.min(), which.max()which() which(), which.max(), which.min()返回是位置(索引) which(x, arr.ind...[1] 2 4 5 7 8 9 > which.min(x) #显示min(x)所有数值位置 [1] 3 > which.max(x) #显示max(x)所有数值位置 [1] 4 > plot...:把列合并为矩阵 rbind:把合并为矩阵 diag:矩阵对角元素向量或生成对角矩阵 aperm:数组转置 nrow, ncol:计算数组行数列数 dim:对象维向量 dimnames:对象维名

2.3K21
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言-因子

    因子表因子(factor)是R语言中许多强大运算基础,因子设计思想来着统计学名义变量(分类变量),因子可以简单看做一个附加了更多信息向量。...,求连乘factorial()函数,求阶乘max()函数,求最大值,min()函数,求最小值,range()函数,同时返回最小值与最大值which.max()函数返回最大元素位置,which.min(...)函数返回最小元素位置median()函数,求中位数var()函数,计算方差rev()函数,对元素去逆序列sort()函数,将元素按升序排列,order()函数,从小到大返回他们各自位置cumsum...()函数,累计,第n个元素是1加到npmax(a,b)函数返回一个向量,第i个元素是ai与bi最大值、pmin(a,b)函数返回一个向量,第i个元素是ai与bi最小值match(x,y)函数...,返回一个x长度相同向量,表示x与y中元素相同元素在y位置(没有则返回NA)choose(n,k),求组合数,n个中选出Kunique(x),如果x是一个向量或数据框,则返回一个类似的对象但是去掉所有重复元素

    9010

    R语言数据集合并、数据增减、不等长合并

    数据选取与简单操作: which 返回一个向量中指定元素索引 which.max 返回最大元素索引 which.min 返回最小元素索引 sample 随机在向量抽取元素 subset 根据条件选取元素...(b, collapse = ",") #不同向量合并在一起,但是变成一个向量 mode(b) #变量类型 mode(c) 4、cbindrbind函数 cbind()rbind...rbind()按照横向方向,或者说按方式将矩阵连接到一起 rbind/cbind对数据合并要求比较严格:合并变量名必须一致;数据等长;指标顺序必须一致。...#do.call函数在数据框执行函数函数,数据列) library("plyr") #加载获取rbind.fill函数 #第一种方法 list1<-list() list1[[1]]=data.frame...(Job_Pwordseg.ct[2])))) 核心函数是plyr包rbind.fill函数(合并数据,必须是data.frame),do.call可以用来批量执行。

    13.3K12

    基于Python数据分析之pandas统计分析

    d1.count() #非空元素计算 d1.min() #最小值 d1.max() #最大值 d1.idxmin() #最小值位置,类似于Rwhich.min函数 d1.idxmax...() #最大值位置,类似于Rwhich.max函数 d1.quantile(0.1) #10%分位数 d1.sum() #求和 d1.mean() #均值 d1.median() #中位数...在实际工作,我们可能需要处理是一系列数值型数据框,如何将这个函数应用到数据框每一列呢?可以使用apply函数,这个非常类似于Rapply应用方法。...常用有三大类方法,即删除法、填补法插值法。 删除法 当数据某个变量大部分值都是缺失值,可以考虑删除改变量;当缺失值是随机分布,且缺失数量并不是很多是,也可以删除这些缺失观测。...其中参数frac是要返回比例,比如df中有10数据,我只想返回其中30%,那么frac=0.3。 有时候,我们可能需要打混后数据集index(索引)还是按照正常排序。

    3.3K20

    R语言入门系列之一

    R语言通过函数(function)来提取对象属性、变量运算,函数可以来自R平台,也可以来自各种软件包(package)、自定义函数。 R语言不用事先声明对象或变量,对象在赋值时同步创建。...sinmin()返回最小值,此外which.min()返回最小值idmax()返回最大值,此外which.max()返回最小值idabs()返回数值对象绝对值sum()返回对象元素prod()返回对象元素乘积...类别(名义型)变量有序变量在R称为因子(factor)。...#为每个对象命名 举例如下: 列表索引可以使用双括号[[]]加编号或者名字,也可以使用$加名字提取,如下所示: 列表是一种简单数据组织调用方式,很多函数计算结果也是列表(例如lapply()...⑵带分隔符文本文件导入数据 函数read.table()可以带分隔符文本文件导入数据,此函数读入一个表格格式文件并保存为数据框,使用方法如下: read.table("file", header

    4.1K30

    R语言入门 Chapter01 | 向量

    R向量概念与数学之间向量是不同类似于数学上集合概念,由一个或多个元素所构成。 向量其实是用于存储数值型、字符型或逻辑型数据一维数组。 用函数C来创建向量。...其中R内置函数,格式为为向量有: euro rivers stat.abb state.name state.area 2、创建向量查看向量 1、创建向量 1、创建向量:c(),...45 47 49 # 向量a前三个元素相加 > a[a[3]] [1] 21 2、Seq()函数 Seq()函数可以按照指定规律创建向量 # 创建一个5到20向量 > seq(5,20...> a <- c(2,3,4,2,5,1,6,3,2,5,8,5,7,3) # 最大值位置 > which.max(a) [1] 11 # 最小值位置 > which.min(a) [1] 6...# 最小下标的值 > a[which.min(a)] [1] 1 # 向量中值为2下标 > which(a==2) [1] 1 4 9 # 向量2所在位置 > a[which(a==2)]

    1.1K20

    新版TCGAbiolinks包学习:表达矩阵提取(mRNAlncRNAcountstpmfpkm)

    因为里面直接包含了表达矩阵、样本信息、基因信息,可以非常方便通过内置函数直接提取想要数据,再也不用手扒了!!...这个对象结构是这样: 是不是感觉单细胞SingCellExperiment对象非常像~ SingCellExperiment 上次我们下载了常见组学数据,今天学习下怎么提取数据,就以TCGA-READ...分别提取mRNAlncRNA表达矩阵,还要添加gene symbol那种! 加载数据R包 加载之前下载好数据。...,就像对数据框取子集那样,选择符合条件列,并且子集也是SummarizedExperiment对象!...添加gene_symbol 添加gene_symbol也就非常简单了,只要提取gene_name这一列,然后原来表达矩阵合并即可!

    2.3K50

    灰太狼数据世界(三)

    关于dataframe统计函数,这里就不多说什么了,具体已经在Serires那个章节列详细出来了。具体可以参考以下方法。...df.count()#非空元素计算 df.min()#最小值 df.max()#最大值 df.idxmin()#最小值位置,类似于Rwhich.min函数 df.idxmax()#最大值位置,类似于...Rwhich.max函数 df.quantile(0.1)#10%分位数 df.sum()#求和 df.mean()#均值 df.median()#中位数 df.mode()#众数 df.var()...apply函数可以对DataFrame对象进行操作,既可以作用于一或者一列元素,也可以作用于单个元素。apply最神奇地方就是它里面可以调用函数,我们经常在apply里面写一些功能匿名函数。...从上面例子结果我们看出数据里面的所有数字都被乘上了2,这就因为我们apply函数里面写了一个匿名函数,将原来数据变成两倍(如果你对lambda不懂,可以参考之前文章,介绍python里面的高级函数

    2.8K30

    最优子集回归算法详解

    01 模型简介 最优子集回归是多元线性回归方程自变量选择一类方法。全部自变量所有可能自变量组合子集回归方程挑选最优者。...,可以直观看出共线性:每个格子椭圆面积越小,表示相关性越强。...(best.summary$cp)#马洛斯Cp值 which.max(best.summary$adjr2) #调整R2 which.min(best.summary$bic) #贝叶斯信息准则 执行最优子集回归后返回是自变量组合子集回归方程...,以及每个回归方程对应评价指标,采用which函数选取最优回归方程。...可做图观察,图横坐标为自变量,纵坐标是调整R2,且最上面的变量搭建回归方程调整R2是最大,同时利用coef()可以查看最优回归方程回归系数,结合来看变量APSLAKE、OPRCOPSLAKE是筛选出来变量

    4K51

    ggplot2可视化拷贝数变异CNVGISTIC score

    ,纵坐标是G-Score,红色表示扩增,蓝色表示删失,如果要用ggplot2画这个图,那我们也要有这个数据才!...在GISTIC2.0输出结果,有一个scores.gistic文件,我们可以用VScode打开看看: 看看它列名,真是太巧了,竟然和我们需要数据非常相似,有gistic score,也有染色体位置...通过半天学习,我知道了BSgenome这个东西,还知道了人类全基因组序列包BSgenome.Hsapiens.UCSC.hg38,这里面就有各个基因组位置长度信息。...然后再继续学习下就知道BSgenome也是一个对象,可以通过特定函数提取信息。 OK,下面就开始提取信息了!...然后就是计算0开始每条染色体位置坐标,就是简单线段长度加减法,不过对于我这种好久不搞数学的人来说也是很费脑子

    2.5K60

    【学习】笨办法学R编程(三)

    看到各位对“笨办法系列”东西还比较感兴趣,我也很乐意继续写下去。今天示例将会用到数据框(data.frame)这种数据类型,并学习如何组合计算两个向量,以及如何排序。...回文数是指一个像1534351这样“对称”数,如果将这个数数字按相反顺序重新排列后,所得到原来数一样。开始啦!...(x) x[which.min(x)] x[order(x)] y <- 1:10 data <- data.frame(x,y) class(data) head(data) data[1,] data...[,1] data$x data[order(data$x),] # Project Euler 4 # 在两个三位数字乘积,找出最大回文数 # 先建立一个将数字顺序进行反转函数 reverse...如果不用expand.grid函数的话,可以利用嵌套for来组合计算。另外还有一种作法是利用R本身rev函数,先将数字转为字符,再切开成一串向量,用rev反转后判断。

    1.2K50

    分组计算描述性统计量函数—by()函数

    将以上学徒信息构建成数据框,存到biotrainee变量名: biotrainee <- data.frame(name = c('xg','xj','hj','wh','xs'),...在list上逐个元素调用FUN函数。可以用于data.frame上,因为data.frame是一种特殊形式list。...到这里by()函数用法就讲完了,只讲基本用法,不讲在实际数据分析过程能解决什么问题?...在id转换过程,经过一系列处理我们得到了ids,它与我们提取表达矩阵exp探针顺序一一对应: > head(ids) probe_id symbol 1 7896759 LINC01128...第三个参数是我们自己定义函数:计算每个小矩阵每行探针表达量平均值(也就是每个探针在6个样本中表达量均值rowMeans(x)),再取平均值最大那个探针作为该symbol所对应唯一探针which.max

    1.1K21

    R语言函数

    1.初级统计(R_01) x<-(1,2,3,4,5,6) max(x) #最大值 min(x) #最小值 mean(x) #均值 median(x) #中位数 range(x)#返回最小值最大值 var...trunc()#返回整数部分 which.max(c(1,2,3,5,6))#返回最大值所在位置,5 2.有重复用rep(),有规律序列用seq(),随机数用rnorm() rep("x",times...%in% x %in% y #x每个元素在y存在吗 y %in% x #y每个元素在x存在吗 #取交集intersect会去重复,而%in%不会 6.向量筛选(取子集)——[] x <- 8:12...#x[x<-2]改为x[x< -2],注意区分赋值号小于-2 ####修改向量某个/某些元素:取子集+赋值 x #改一个元素 x[4] <- 40#将x第4个值改为40 #改多个元素 x...为2表示列,FUN是函数 test<- iris[1:6,1:4] apply(test, 2, mean)#求test所有列平均值 apply(test, 1, sum)#求test所有 7.2

    24120

    python数据分析——数据选择运算

    它们能够帮助我们海量数据中提取出有价值信息,并通过适当运算处理,得出有指导意义结论。 数据选择,是指在原始数据集中筛选出符合特定条件数据子集。这通常涉及到对数据筛选、排序分组等操作。...综上所述,Python在数据分析数据选择运算方面展现出了强大能力。通过合理数据选择恰当运算处理,我们可以数据获取到宝贵信息洞见,为决策提供有力支持。...关键技术:多维数组选择,使用[ ]运算符只对行号选择即可,具体程序代码如下所示: 花式索引与布尔值索引 ①布尔索引 我们可以通过一个布尔数组来索引目标数组,以此找出与布尔数组中值为True...merge()是Python最常用函数之一,类似于Excelvlookup函数,它作用是可以根据一个或多个键将不同数据集链接起来。...关键技术: mean()函数能够对对数据元素求算术平均值并返回,程序代码如下所示: 中位数运算 中位数又叫作中值,按顺序排列一组数据位于中间位置数,其不受异常值影响。

    17310
    领券