如果你是Python的用户,那么你很有可能用过jupyter notebook,至少看别人用过吧!很多用Python做数据分析工作的人都会用它。本文要介绍的不是用jupyter notebook写Python代码,而是用jupyter notebook写R代码。
一般,我们在Rstudio里面写R代码,Rstudio的确是一个很棒的编辑器。但是如果我们想要把代码和输出同时展示出来,直接把数据分析的过程和结果展示给同事或者其他人看,那么怎么办呢?用Rmarkdown吧,感觉使用起来还是有点不方便,作为一个同时用Python和R的数据分析师,想到jupyter notebook是多么方便啊。很久以前的一天,我无意间翻阅jupyter的官网,看到了它支持的语言列表,发现它支持R,当然还支持 Julia,Scala,Matlab,Stata等与数据分析或统计分析相关的语言,甚至还支持Java......
前段时间,我自己就在jupyter 里面安装了R的kernel,这样我就可以在jupyter里面写R代码了,用了一段时间,发现体验还是相当不错的,所以将使用方法分享给大家。
如下是步骤,推荐哪些会用R的人进行尝试。如果你还不会R,先把这个东西记着,说不定将来有一天,你会对此感兴趣。
一、安装anaconda和R
如果你电脑里面还没有jupyter的话,就直接去下载安装一个anaconda,这是Python的数据分析集成发行版,安装好之后,就有了jupyter。anaconda国内下载镜像:
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
我相信作为要实践这篇文章所述内容的人,你应该已经安装了R。如果没装的话,下面是地址:
https://www.r-project.org/
二、安装需要的R包
需要在R中安装几个R包,简单点,你在R中运行如下的代码就可以了。
install.packages(c('repr','IRdisplay','evaluate',
'crayon','pbdZMQ','devtools',
'uuid','digest'))
devtools::install_github('IRkernel/IRkernel')
上述包安装完毕后,执行如下的R代码,使得在jupyter里面,可以看到R。
IRkernel::installspec(user=FALSE)
三、开始在jupyter中使用R
打开命令行,输入jupyter notebook,开启jupyter notebook 服务,你将能够在新建jupyter文件的位置看到可选的R语言。
需要注意的是,在jupyter 里面使用R安装R包的时候,必须指定镜像,否则会下载失败。你可以在每一个jupyter文件的开始部分,运行如下代码,设定好镜像,之后安装R包时,就无需设定镜像,直接安装即可。
# 通过如下命令设定镜像
options(repos='http://mirrors.ustc.edu.cn/CRAN/')
另外,在jupyter里面,需要按tab键,才会出现代码补全提示。其它方面,和在Rstudio里面使用R没有差异。
下图是在jupyter 里面用R做机器学习模型的部分片段截图。效果大概就是这样。
当然还有画图的,R出图效果以及便利性,比Python要强很多。比如,下面是利用R绘制ROC曲线,评估分类模型的一个例子。
领取专属 10元无门槛券
私享最新 技术干货