书接上回!
安装和了解了R的基本内容之后,开始进入其第一功能——制作图表。(网上说其在数据统计分析与做图、数据挖掘、计量经济学、实证金融学等领域有所应用,具体并不清楚,以后详表)
一、从excel中导入数据
我从excel中导入数据用了以下两种方法。excel中的数据为两列,A列是日期,B列是含量,这是工作中经常用到的数据,文件名是”content“。
方法一:
将xls格式另存为csv格式的文件,用R-Import text(base)选择文件打开
方法二:
在excel中复制,到R中用read.table("clipboard")命令打开。
二、转换格式
导入R中的数据存储在list中,不能直接用于做图。需要将其转化为double或者integer类型。用最简单的赋值形式:
a
再用typeof()检查a和b的数据类型,已经改变。
三、hist函数做图
1. 基本做图
hist(b)
2. 划分区间
将波动范围划分区间,按照区间进行统计。
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31))
3. 显示出现次数/次数百分百
按照出现在区间的实际个数或者百分比计算,统计实际个数时freq=T,百分比时用freq=F,并且用main显示图表标题。
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
freq=T,main="freq=T")
4. 标签
每个区间内显示标签,如图A,B, C……
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
labels=c("A","B","C","D","E",
"F","G","H","I","J"))
5. 坐标轴
用axes=T或者F显示或者取消显示坐标轴。
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
axes=T,main="显示坐标轴")
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
axes=F,main="不显示坐标轴")
6. 颜色
用col定义选择显示的颜色。
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),col="pink")
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
col=rainbow(10))
7. 柱图边框
用border选择是否显示边框
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
col=rainbow(10),border=NA)
8. 斜线填充
用density和angle选择斜线密度和角度。
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
density=3,angle=60)
以上命令可以单独使用,也可以组合使用,比如
hist(b,breaks=c(30.0,30.1,30.2,30.3,30.4,
30.5,30.6,30.7,30.8,30.9,31),
density=2,col="pink",axes=F)
显示了如下图表:
还有哪些应用,继续学习研究。
收获:
用R做图挺好玩的,虽然目前用起来并没有excel快速,但很听话,比较锻炼想象力,需要头脑中先有想法后用命令实施,是创意题;而excel中更多的是试试看,关注喜欢与否,是选择题。
问题:
更新数据后,所有的图形格式等应该不用重新来过吧?!
虽然网上说R比excel强大太多,我尚无感受到,慢慢探索吧!
领取专属 10元无门槛券
私享最新 技术干货