本文是“R语言数据分析与实践”公众号暑期系列的第3篇文章:R语言最强IDE——RStudio
RStudio是R的IDE,在安装RStudio前需要已经安装好R。Win版的RStudio安装请确保将RStudio安装到与R的同一路径下。
本文中,将介绍支持R语言的几款主流IDE(Integrated Development Environment)。IDE是能够帮助工程师快速开发/编程/调试/生成说明文档的平台。
RStudio作为R的IDE,可以帮助工程师快速的开发/调试/修改/生成说明文档。对于没有经过严格编程训练的数据开发/分析人员来说,RStudio的“一键式”操作是非常强大的功能。
RStudio除了IDE常见的强大功能外,还包括了RMarkdown、knitr、RNotebook、shiny APP等实用扩展功能。
创建工程
对于大型项目的分析,需要一个团队的协同工作。这时候需要创建一个工程项目来保障项目的持续性和记录,组内不同的人员根据项目分工,可在项目中创建相应的文档/文件夹来负责不同的数据(清洗/整理/分析/检验)工作。
工程文件可以帮助用户进行大项目和多人协作的开发。
数据导入
目前R支持的数据格式有32种,同时包括商业数据软件API接口。不同格式的数据,在RStudio中都可以实现“一键式”导入任务。
传感器数据
目前,很多领域的数据来自传感器收集,(眼球跟踪技术/商场顾客流通人数等),这种类型的数据由于受到设备限制,多为.rtf格式。
快捷操作
MacOS快捷输入(Win与Mac命令是相同的,只有文件路径、部分快捷键不同)
清空控制台:
control
+
L
>-快速输入:option+—(减号/下划线,位于字母0的右边)
代码补全:tab键(位于键盘上,大写锁定caps lock上方)
数据清洗
数据清洗是获得可信度数据的重要一步,这一步将对后续的数据分析正确性起到关键影响。在数据清洗/预处理时,通常还需要对数据的置信区间/置信度进行说明。
packages
packages的加载/导入/卸载等相关操作,在RStudio中可以通过零代码“一键式”操作实现。这适合没有经过严格编程训练的数据分析师。
领取专属 10元无门槛券
私享最新 技术干货