2018年1月1日摄于草莓园
导语
新年的第一天,从R开始。2016年学了R语言的入门,因为工作上零接触的关系,基本上考完试就把知识扔一边了。上大学的时候养成了一个最有效的学习方法,便是将知识一步步的分解,再以说故事的方式讲解给其他人听,保证听众理解的同时,自己也省去了再去消化复习的时间。
这个号里的文章将会是自己的复习笔记,都是一些入门级别的内容。适合除了做作业谈恋爱打手游之外还有闲暇时间看看朋友圈和公众号的中小学生,待业待产待娶待嫁,吸猫吸狗追剧炒股淘宝的地球人。
R Programming 101 开篇
Data Science是这几年特别热门的学科。多年前我们管它叫统计,或者计算机科学。随着庞大的互联网的数据的产生,出现了各式各样的商业需求,需要通过现有数据得到更好的解决方案,于是给予了这个传统的数据分析行业一个高大上的名词:Data Science,以前的Data Analyst也有了新title —— Data Scientist。
R和Python是Data Scientist最常用来处理分析大量数据的两种编程语言。关于R和Python的比较,之后会再出一个详细的文章。我在工作中基本上也很少用到Python。刚上大学时候的入门课是Java,几年前系里已经开始用Python做入门了。工作时用的编程语言是C#,SQL, Javascript,有时也写一些Java。几年前一个项目曾经写过几周的Python script,印象里简单易懂好上手,但确实没有太深入系统的地学习。
R为统计学而生,有着强大的package support与图像功能,使得代码更加的精简 (虽然运算缓慢),常用于大量数据的分析报告,Python更适用于与应用的integration之中。e.g. 如果我们要在一个电子商务后台管理系统上开发出一个dashboard功能,来观察现有的production database里的销售数据,Python便是一个不错的选择。
谈到R的诞生,先要谈谈ta的前世S。S是贝尔实验室的John Chambers,Rick Becker与Allan Wilks在1976年共同研发的统计编程语言,在1993年左右奥克兰大学的Robert Gentleman and Ross Ihaka开发出了R,一个基于S语言的GNU package。
Robert Gentleman和Ross Ihaka奥克兰的Black Crow 咖啡店
2017年Ross Ihaka于奥克兰大学
关于R的三个小数据
1. R的核心团队大约有20个成员,这是一个国际性的统计学派研究团队的合作;
2. 每年,CRAN (comprehensive R archive network) 上都会发布2次R的新版本,软件的license属于“free software”,每个用户都可以免费地下载和使用
3. CRAN平台上已经发表了3500个R的 extension packages
链接
https://www.r-project.org/
https://cran.r-project.org/mirrors.html
?
那么问题来了,R语言的名字来源是?
碎碎念
今天下午在Netflix上看新鲜出炉的black mirror,学了一句话:He's a coder, he's fallible.
艾微
软件工程师
产品负责人
IT人。岛漂。游客。
领取专属 10元无门槛券
私享最新 技术干货