今天是生信星球陪你的第78天
你想找辆共享单车,发现满街都是别家车,没有一辆你能骑。
你想学点生信,搜了“初学者教程”,满眼尽是高大上,没有一句能看懂。
终于你跨越茫茫宇宙,来到生信星球,发现了初学者的新大陆!
小抄常识早知道
(1)R的赋值符号不是等号,而是
(2)在Console 控制台输入命令,相当于Linux的命令行
(3)显示工作路径 getwd()
设置工作路径 setwd(/home/u1234/R)
(4)向量是由元素组成的,元素可以是数字或者字符串。
(5)表格在R语言中改名叫数据框^_^
(6)数据类型
向量(vector)
矩阵(Matrix)
数组(Array)
数据框(Data frame)
List
1.标量和向量
标量:一个元素组成的变量
定义字符串变量:a
向量:多个元素组成的变量
x
x
x
x
从向量中提取元素
(1)根据元素位置
x[4] 第4个元素
x[-4]排除法,除了第4个元素之外剩余的元素
x[2:4]第2到4个元素
x[-(2:4)]除了……
x[c(1,5)] 第1个和第5个元素
(2)根据值的大小
x[x==10]等于10的元素
x[x
x[x %in% c(1,2,5)]存在于向量c(1,2,5)中的元素
2.数据框
(1)读取
read.table(file = "a.txt",sep = "\t",header =T)
#读取文件,分隔符为table,有表头
a
数据框由行名和列名组成
查看列名colnames(a)
查看行名rownames(a)默认值为1.2.3.4行号
有的公司返回数据,左上角第一格为空,R会自动补为x
修改:colnames(a)[1]
修改第一列为行名:a
查看帮助:?read.table
(2)修改/导出
write.table(a,file = "a_out.txt",sep = ",",quote=F) #分隔符改为逗号,字符串不加双引号(默认格式带由双引号)
(3)保存与重新加载
保存当前所有变量save.image(file="example.RData")
保存其中一个变量save(df1,file="df1.RData")
使用时 ,load (df1.RData)
(4)提取元素
a[x,y]第x行第y列
a[x,]第x行
a[,y]第y列(横着写)
a[y] 第y列(竖着写)
a[a:b]第a列到第b列
a[c(a,b)]第a列和第b列
(5)直接使用数据框中的变量
提取第b、c列作散点图:
plot (a$b列名,a$c列名)
--缺点:数据框名a在代码中重复出现
解决:
方法1:attach(只用一个数据框)
将数据框名添加到搜索环境中:attach(a),作图时就只需输入列名。
做完后将a删除出搜索环境 detach(a)
局限性:两个以上数据框列名有冲突,同时attach会报错。
方法2:with
with(a,{
plot(a$列名,b$列名)#用a、b列作图
x
})
x #运行完后打印x
初学生信,很荣幸带你迈出第一步。
领取专属 10元无门槛券
私享最新 技术干货