2018年,玩数据和用数据的朋友们,努力成为一名数据科学家。
战略层面如何成为一名数据科学家,借用曾国藩的一段话。
士人读书,第一要有志,第二要有识,第三要有恒。 有志,则断不甘为下流。 有识,则只学问无尽,不敢以一得自足;如河伯之观海,如井蛙之窥天,皆无见识也。 有恒,则断无不成之事。 此三者缺一不可。
简单地说,就是“三要”。
战术层面如何成为一名数据科学家,可以考虑下面六个步骤。
这个步骤用来培养和构建数据科学思维,熟悉数据库技术,掌握数据爬虫技术。
1 喜欢品酒的朋友,想识别青岛啤酒和百威啤酒,需要什么数据,数据在哪里,如何获取这些数据?
2 您喜欢听歌,音乐产品想给您推荐喜欢的歌曲,需要什么数据,数据在哪里,如何获取这些数据?
这个步骤用来熟练掌握和综合使用R语言和Python语言,或者SAS/SPSS/Matlab等商业化软件。学习编程的唯一方法,就是坚持写代码,写代码,写代码!!!
1 R语言和Python语言共同点和差异性分别是什么?
这个步骤用来掌握数据探索性分析和培养讲数据故事的能力。
1 R语言ggplot2包如何绘制公开出版的折线图和气泡图?
2 Python语言如何绘制可交互式地动态图?
这个步骤用来掌握和熟练原始数据精加工的能力,经过数据处理后,生成可以用于分析和建模的数据,并输出中间数据。
1 R语言如何做数据处理?
2 Python语言如何做数据处理?
3 R语言和Python语言综合如何做数据处理?
这个步骤用来熟悉统计学和机器学习的知识,并且服务于具体的数据问题。
1 统计学用来解决什么问题?
2 机器学习适合解决什么问题?
这个步骤用来培养交流和沟通的能力,让数据洞见和知识服务于更多相关人士。
1 如何生成自动化数据报告?
2 如何做数据报告?