首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R语言之基本包

str(Familydata) # ==============显示结果============= # 首先给出了对象的类型(这里是数据框“data.frame”)、观测数和变量的个数; 'data.frame...2.选取数据框的子集 与矩阵类似,我们可以用索引下标的方式选取数据框的子集。...如果还要进一步使用该子集,需要把它存为一个新的对象。 在机器学习领域,经常需要从数据集里随机抽取一部分样本。...3.将数据框按照某个变量的值排序:order( ) 有时我们想将数据框按照某个变量的值的大小进行排序显示,这可以借助函数 order( ) 实现。...例如《R 语言医学数据分析实战》推荐的做法是: 在开启一个新的分析项目时,首先使用命令 rm(list = ls( )) 从 R 工作环境中清除所有对象; 在分析过程中用函数 detach( ) 将不再需要使用的数据框从搜索路径中移出

28920
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    R语言 数据框、矩阵、列表的创建、修改、导出

    数据框数据框的创建数据框来源主要包括用代码新建(data.frame),由已有数据转换或处理得到(取子集、运算、合并等操作),读取表格文件(read.csv,read.table等)及R语言内置数据函数..."",文件名是真实存在的文件,要有""#直接读取如果失败,需要指定参数#ex1 所有数值型改为字符型以满足向量同一类型...,列数)的单元格df1[2,] #取出第二行的所有内容df1[,2] #取出第二列的所有内容,同df1$df1[c(1,3),1:2] #取出第1、3行的1、2列数据,取多列的时候需要组织成合适的向量df1..."及"change"的单元格逻辑值取子集df1[df1$score>0,] #取出列为score的向量中值大于0的数据对应的行#筛选score > 0的基因df1[df1$score > 0,1] #df1...$score > 0生成一个长度与df对应的逻辑值向量,取出行为TRUE的且列数为1的df1$gene[df1$score > 0] #先取出列名为gene的向量,在给出一个一一对应的逻辑值向量数据框修改修改数据相当于定位取出数据后赋值

    7.9K00

    从零开始的异世界生信学习 R语言部分 02 数据结构之数据框、矩阵、列表

    数据框 data.frame 数据框 约等于表格:1.数据框不是一个具体文件,只是R语言内部的一个数据;2.数据框每一列只能有一种数据类型 图片 新建和读取数据框 #新建和读取数据框 df1 data.frame...## 中括号中的逗号表示维度的分隔 ## 按名字 df1[,"gene"] df1[,c('gene','change')] ## 按条件(逻辑值) df1[df1$score>0,] ## 代码思维...rownames(df1) <- c("r1","r2","r3","r4") #只修改某一行/列的名 colnames(df1)[2] <- "CHANGE" # | 或符号前后不可以连接字符,只能用于数字,逻辑值...merge(test1,test3,by.x='name',by.y = 'NAME', all.x = TRUE,sort = T) #左连接,即新合并的数据框中,保留test1中保留选中的name列中的所有元素...merge(test1,test3,by.x='name',by.y = 'NAME', all.y = TRUE,sort = T)#右连接,即新合并的数据框中,保留test3中保留选中的name列中的所有元素

    1.8K20

    R3数据结构和文件读取

    第二个参数表示结束值,第三个参数length.out表示需要生成的数字数量。...(1)比较运算(逻辑比较),循环补齐,生成等长的逻辑向量(向量不一样长时,谁长取谁)(等位运算,向量长度不相等时,发生循环补齐,等位运算注意非整倍数有时会造成结果错误,如x$Species==c("a"...,"c"))(2)数学计算(3)连接paste0,循环补齐,生成等长的逻辑向量(4)交集intersect会去重复(所以两个向量取子集,有哪些重复时,结果可能会出错,需要用%in%)、%in%,输出的是逻辑值...,dim,nrow,ncol,rownames,colnames,修改和取子集# (4)R语言内置数据iris,volcano,letters,可用view查看数据#2.新建和读取数据框df1 data.frame...如果需要保留所有列并仅去除重复行,则可以将上述代码中的c("column_name")替换为NULL,即:df_unique <- unique(df)这会返回一个去除重复行后的完整数据框df_unique

    2.8K00

    - 数据的过滤

    总结一些从数据库表中提取子集的过滤方式 WHERE 样例 select * from student where id > 3; where后面跟逻辑语句,筛选出符合条件的子集 WHERE子句操作符...= 不等于 < 小于 <= 小于等于 > 大于 >= 大于等于 BETWEEN 在指定的两个值之间 样例 检查单个值:select name from student where name='Zs'...null与0、空串、空格不同) 组合WHERE and 通过and运算符可以连接多个过滤条件,过滤出满足所有条件的子集。...or 通过or运算符可以连接多个过滤条件,过滤出满足其中至少一个条件的子集。...通配符 当对搜索的值不明确时,适合使用通配符来进行模糊匹配。 通配符:用来匹配值的一部分的特殊字符。通配符本身实际是SQL的where子句中有特殊含义的字符。

    1.1K20

    R语言︱list用法、批量读取、写出数据时的用法

    提取某List某指标 方法一: 先编写一个提取list子集的函数: subdate<- function(x){ x$DATE } 复制代码 然后用lapply或者sapply sapply...(需要自己编写循环) 参考于:http://bbs.pinggu.org/thread-3410181-1-1.html 方法三:提取长度大于某程度的list x[lapply(x, length)>...———————————————————————————————————————————————————————————————————— unlist与list的区别 unlist(x)生成一个包含x所有元素的向量...——先定义list 2、如何定义写出时候的文件名字——paste函数 批量读取的基本流程就是:写入(list[[i]])、操作、写出 #1、读取xlsx中所有的sheet表格 #如果像vector一样定义...[1],Job_Pwordseg.ct[2]) 不等长合并的时候,rbind.fill函数可以很好将数据进行合并,并且补齐没有匹配到的缺失值为NA。

    17.8K52

    R语言学习笔记-Day3

    100 59 73 95 45names(scores)[scores>60]## [1] "jimmy" "Damon" "Sophie"#数据框按照逻辑值取子集...用已有数据转换或处理得到(3) 读取表格文件(存在于R语言之外的文件,只操作数据框而不修改表格)(4) R语言内置数据(heatmap(volcano);iris;letters;LETTERS),并非所有内置数据都是数据框...3 -2 -4 #删掉score,按tab键可自动显示列名mean(df1%score) 1 0.5#统计表格中有多少某一列有多少元素:table()table(test$strand)**数据框取子集按名字..." "gene3" "gene4"df1,c("gene","change") (可一次取多列,列名需加"")按坐标df12,2 "up"df12, ;df1,2df1c(1,3),1:2;##按逻辑值(...,by.x="name",by.y="NAME",all=T) / merge(test1,test3,by.x="name",by.y="NAME",all.x=T,all.y=T) *矩阵新建和取子集

    17900

    对表型数据框进行去冗余

    很明显,有些信息是冗余的,有些是有效信息可以用来分组,但是表型记录太多,看起来会混淆,所以需要去除那些冗余信息,就是在所有样本里面表型记录都一致的列。...我们来举一个例子,下面的代码创建一个模拟的表型信息; pd=data.frame(1:10,4,7,3,'a','d', LETTERS[1:10],letters[1:10...], c(rep('a',5),rep('b',5))) 如下所示,只有第1列和最后3列是有信息的,中间的列在所有行都是同一个元素,就是我们所认为的冗余信息,需要去除。...这样虽然是判断了每一列的非冗余元素个数,但并不是逻辑值,没办法去用来对数据框取子集。...需要加上一个判断,就是元素个数大于一才保留; apply(pd, 2, function(x){ length(unique(x)) > 1 }) 现在就是依据每一列返回一个逻辑值,这个逻辑值就可以去原始数据框里面进行取子集操作

    53230

    MySQL(三)用正则表达式搜索

    仅支持多数正则表达式实现的一个很小的子集; 一、基本字符匹配 select column from table where column regexp ‘1000’ order by column; 该语句检索列...(除非使用通配符) ②regexp在列值内进行匹配 select column from table where column regexp ‘1000’ order by column; 该SQL语句会返回一行数据...六、匹配字符类 字符类(character class):有时候需要检索出我们需要的数字、所有字母字符或所有数字字母字符等的匹配,我们可以使用预定义的字符集,称为字符类;如下: ?...七、匹配多个实例 有时候需要对匹配的数目进行更强的控制,比如:寻找所有的数,不管数中包含多少数字,或寻找一个单词并尾随一个s(如果存在)等情况,我们可以利用正则表达式中的重复元字符来完成;如下 ?...匹配它前面任何字符的0或者1次出现}) 八、定位符 有时候为了匹配特定位置的文本,需要使用定位符,常用定位符列表如下: ?

    98810
    领券