前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据科学家 (Data Scientist) 的核心技能是什么?

数据科学家 (Data Scientist) 的核心技能是什么?

原创
作者头像
猴子数据分析
修改于 2021-01-29 02:07:30
修改于 2021-01-29 02:07:30
1.6K0
举报
文章被收录于专栏:猴子数据分析猴子数据分析

如何用8步成为数据科学家:

这是国外数据科学学习平台DataCamp成员写的一篇图文《8步成为数据科学家》。我们具体来看下有哪些学习内容和学习资源。

这里说的8步,不是你用8周就可以完成,而是一种学习的方法。这些步骤虽然没有那么简单,但是都是可操作,可实践的。只要你投入时间去学习,相信时间的积累力量,就可以掌握这些知识。

首先,什么是大数据科学家?

数据科学家是一个跨学科人才,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。需要掌握的知识有数学统计,编程能力,机器学习,研究能力等。

目前,数据科学家大部分是本科或者硕士学历(本科37%,硕士31%)。但是不要担心,从调查数据来看,有5%高中毕业的人也成为了数据科学家。这足以证明,只要你努力去提供自己,英雄是不问出处的。

第1步:学好统计、数学和机器学习

下面给出了学习这些知识的资源。如果感觉这些资源学起来太难,可以从《赤裸裸的统计学》、《深入浅出统计学》这两本书入门。

第2步:学会编程

掌握计算机科学的基础知识,学会系统开发的整个过程(end-to-end development),因为你做的东西会成为其他系统的一部分。

选择一种数据分析的编程语言,例如开源软件的R , Python语言等,或者商业软件的SAS, SPSS等。

在学习过程中可以用DataCamp, tryR, Codecademy或Google Class进行交互式学习。

第3步:理解数据库

在大部分的实际数据分析项目中,数据大部分是存储在数据库中的,所以你的学会数据库的操作,如关系数据库MySQL,非关系型数据库MongoDB等。

第4步:学会数据预处理、可视化和报表制作

1. 数据预处理

在数据分析师的工作中,有多达60%的时间都花在了实际分析前数据的准备上。数据预处理的目标是为了把数据改变成我们喜欢的样子,以便于后期的分析处理。这就好比,现在很多女孩照相喜欢用美图秀秀,眼睛不大,那我就用美图秀秀把眼睛变大。变成自己喜欢的样子。

数据预处理可自学Coursera中《Getting and Cleaning Data》的 课程(作者:John Hopkins)。也可以用工具DataWrangler、R语言的data.table和dply包。

2.数据可视化是将数据分析的结果显示出来,便于展示。实用工具有ggvis, D3, vega。

3.数据报表作为数据分析的最后一步,是将数据分析和结果制作成易于理解的报告。实用工具有Tableau, Spotfire和R Markdown。

第5步:提升到大数据级别

当你开始处理海量规模的数据时,绝大多数的数据科学家要解决的问题,都无法在单机上完成,需要用分布式处理大数据集,使用的工具有Hadoop,Apache Spark

第6步:多实践,与数据科学家大牛多交流

幸好是互联网时代,我们可以通过网络认识大牛,并从他们分享的知识内容中学到更多经验知识。当然,你也可以通过参加比赛,做小项目获得更多的实践经验。

第7步:实习、实战、或找份工作

判别自己是不是一个真正的数据科学家的最佳途径,就是用你新学的知识迎难而上,进入数据分析的工作领域。

第8步:通过专业社区学到更多

数据分析的网站有:DataTau, Kdnuggets, fivethirtyeight, datascience101, r-bloggers。

可以看这些数据科学大牛的博客:Hilary Mason, David Smith, Nate Silver, dj patil。

可以从quandl上获取数据。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
数据科学家 (Data Scientist) 的核心技能是什么?
这是国外数据科学学习平台DataCamp成员写的一篇图文 8步 成为数据科学家。我们具体来看下有哪些学习内容和学习资源。
猴子数据分析
2024/05/18
1540
数据科学家 (Data Scientist) 的核心技能是什么?
如何成为数据科学家?
这是国外数据科学学习平台DataCamp成员写的一篇图文 8步 成为数据科学家。我们具体来看下有哪些学习内容和学习资源。
猴子数据分析
2021/03/15
7980
[译]天龙八步:8步让你变成数据科学家
大数据文摘翻译作品 编译:焦剑,康欣 校对:孙沁(Kiki) 欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权 OK, 这些步骤不是那么简单。但是,它们都是可操作的,并且大多数步骤都是
大数据文摘
2018/05/22
7770
天龙八部:一张图告诉你如何8步炼成数据科学家
如何成为一个数据科学家?不少刚刚接触这个领域的探索者都在寻找一条尽可能正确的道路。 OK, 这条道路确实不是无迹可寻的。虽然并不简单,但是,通过科学的规划和足够的时间投入,数据科学家可以通过很少的花费炼成。 接下来的这张精美的可视化长图从什么是数据科学家说起,然后详细介绍炼成数据科学家的8个步骤。拿好不谢~ 首先,什么是数据科学家?数据科学,是一个多学科知识的交集,甚至包括黑客技巧。数据科学家,是比软件工程师更擅长统计学,比统计学家更擅长软件工程的人。目前,数据科学家的典型教育背景是:高中5%,技校5%,
小莹莹
2018/04/25
1.1K0
天龙八部:一张图告诉你如何8步炼成数据科学家
古有曹子建七步成诗,今有DataCamp教你8步成为数据科学家
这是国外一个非常厉害的数据科学学习平台DataCamp数据科学大牛Karlijn Willems写的一篇图文《8步成为数据科学家》。
陈学谦
2020/06/01
5130
数据科学家养成记:成为数据科学家八步走
但如何能成为一个数据科学家呢? 首先,各个公司对数据科学家的定义各不相同,当前还没有统一的定义。但在一般情况下 ,一个数据科学家结合了软件工程师与统计学家的综合技能,并且在他或者他希望工作的领域拥有大
小莹莹
2018/04/20
9620
数据科学家养成记:成为数据科学家八步走
成为数据科学家,需具备这些技能
文章节选自《机器学习:北美数据科学家的私房课》 文末评论赠送本书,欢迎留言! 目前数据科学和数据科学家成为了流行词汇。当有人问你干什么,你回答说数据科学家,对方会恍然大悟,觉得特别高大上,噢,数据科学家啊,听说过。是啊,没听说过数据科学家那就out了。如果接着问,数据科学家具体干什么的?然后就没有然后了。 不知道你们有没有听说过这样一则轶事,美国最高法院法官Potter Stewart被问到什么是淫秽时,他回答:“看下才知道。”这和数据科学很类似,很多概念,在大而化之的时候都可以存在,大家口耳相传,聊的不亦
用户1737318
2018/06/05
6980
【数据科学】数据科学家与数据科学
仅仅在几年前,数据科学家还不是一个正式确定的职业,然而一眨眼的工夫,这个职业就已经被誉为“今后十年IT行业最重要的人才”了。 一、数据科学家的起源 "数据科学"(DataScience)起初叫"datalogy "。最初在1966年由Peter Naur提出,用来代替"计算机科学"(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言,包括今天那些必不可少的软件工程工具的原型。
陆勤_数据人网
2018/02/26
1.2K0
【数据科学】数据科学家与数据科学
【数据科学家】数据科学家修炼之路
经常有人问我“要成为数据挖掘工程师或者数据科学家应该读什么书?”类似的问题。下面是一份建议书单,同时也是成为数据科学家的指南,当然,这不包括取得合适大学学位的要求。 在深入探讨之前,数据科学家似乎需要
陆勤_数据人网
2018/02/27
9620
【数据科学家】数据科学家修炼之路
数据科学家的自我修养
编者按:谨以此文向著名统计学家、中国人民大学统计学院教授吴喜之教授致敬! 正文: 继云计算之后,大数据已然成为IT行业的热点。《哈佛商业评论》更是宣称“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。这里我不想重复什么是大数据,什么是数据科学,而是直接从数据科学家这样一个神秘的群体开始让大家对大数据和数据科学有个基本的认识。 认识数据科学家 “数据科学家”是舶来语,翻译自英文“Data scientist”,用来描述“一些能综合运用编程和统计技
小莹莹
2018/04/23
9670
数据科学家的自我修养
【数据科学家】如何成为一名数据科学家?
一、数据科学家的起源 “数据科学”(DataScience)起初叫”datalogy “。最初在1966年由Peter Naur提出,用来代替”计算机科学”(丹麦人,2005年图灵奖得主,丹麦的计算机学会的正式名称就叫Danish Society of Datalogy,他是这个学会的第一任主席。Algol 60是许多后来的程序设计语言,包括今天那些必不可少的软件工程工具的原型。图灵奖被认为是“计算科学界的诺贝尔奖”。) 1996年,International Federation of Classific
陆勤_数据人网
2018/02/27
8310
【数据科学家】如何成为一名数据科学家?
数据科学家所需的技能和素质
对数据科学家的关注,源于大家逐步认识到,Google、Amazon、Facebook等公司成功的背后,存在着这样的一批专业人才。这些互联网 公司对于大量数据不是仅进行存储而已,而是将其变为有价值的金矿
小莹莹
2018/04/18
1.3K0
数据科学家所需的技能和素质
【数据科学】Data Scientist的出路是什么?4种数据科学工作,8项求职技能
“数据科学家”被誉为21世纪最性感的工作(Thomas Davenport和D.J. Patil在哈佛商业评论上曾发表的一篇文章中称),但如何成为一个数据科学家?怎样才能入门呢?许多的信息可能导致你认为成为一个数据科学家需要全面的精通一些领域,比如软件开发,数据整理,数据库,统计学,机器学习和数据可视化。 不用担心。从我作为一个数据科学家的经验来说,事实并非如此。你并不需要马上学会一辈子受用的与数据相关的信息和技能。与之相反,你要学会仔细阅读数据科学的职位描述,这将有助于申请那些你已经拥有必要的技能的职位,
陆勤_数据人网
2018/02/26
3.4K0
【数据科学家】揭秘数据科学家
有人给予了大数据专家许多美好的称号,比如“数据开采者”、“数据建筑师”等,但其中最时髦的当属“数据科学家”。当记者在互联网上搜索“数据科学家”这个关键词时,看到的都是“21世纪最性感的职业”、“大数据行业最时髦的职业”等溢美之词。埃森哲大中华区技术咨询董事总经理何悠毅(Jouni Hakanen)表示,目前对数据科学家需求极大。 “性感”的数据科学家 记者采访人人游戏高级数据科学家陈弢时,他提到了当年在香港科技大学计算机系读博士的时候曾听教授这样调侃:“只有那些不能严格被算为科学而又想挤进科学的学科,才会在
陆勤_数据人网
2018/02/27
1.2K0
【数据科学家】揭秘数据科学家
数据科学家的自我修养 | 哪些技能是必不可少的?
市场上对数据科学家的要求特别多:需要掌握机器学习、计算机科学、统计学、数学、数据可视化,深度学习等知识。要想全部掌握这些方面的知识,科学家需要学习数十种语言、框架和技术。那么,为此数据科学家应该如何合理地分配时间,该掌握哪些技能呢?
CDA数据分析师
2018/12/04
5130
数据科学家的自我修养 | 哪些技能是必不可少的?
数据科学家需要怎样的技能组合?
原文:http://developer.51cto.com/art/201604/508969.htm 在2016年的美国,数据科学家已经被冠以“最佳工作”的头衔,数据科学家的定义以及成为一名出色数据科学家所需的技能一直处于不断的变化之中。科技和商业需求方面的进步驱使着数据科学家随着行业的不断变化而不停的进化。在这片文章中,我们将会近距离的看一看在2016年当中,作为一名数据科学家应该扮演何种角色。 Dave Holtz写道,小小的“数据科学家”这样的岗位头衔,经常被充当一个空白头衔来用,其作用就是说明数据
机器学习AI算法工程
2018/03/13
6820
数据科学家需要怎样的技能组合?
3大技能助你成为超级数据科学家!(附链接)
令人惊讶的是,我得到了许多来自不同行业的顶级数据科学家的回应,他们都分享了他们的想法和建议,都很有意思且实用。
大数据文摘
2019/07/02
4720
3大技能助你成为超级数据科学家!(附链接)
数据科学工作者(Data Scientist) 的日常工作内容包括什么?
众所周知,数据科学是这几年才火起来的概念,而应运而生的数据科学家(data scientist)明显缺乏清晰的录取标准和工作内容。即使在2017年,数据科学家这个岗位的依然显得“既性感又暧昧”。 我随手搜索了几家国内国外不同领域的数据科学家招聘广告(国内:阿里巴巴,百度 | 海外: IBM,道明银行,Manulife保险),通过简单的归纳总结,我们不难发现其实岗位要求有很大的重叠部分: 学历要求:硕士以上学历,博士优先。统计学、计算机科学、数学等相关专业。 工作经历: 3年以上相关工作经验。 专业技能: 熟
AI研习社
2018/03/16
2.2K0
数据科学工作者(Data Scientist) 的日常工作内容包括什么?
重磅:如何不花钱就成为数据科学家?
大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+转载”,申请过授权的不必再次申请,只要按约定转载即可 编译|丁雪 校对|王婧 从白宫雇佣DJ Patil作为
大数据文摘
2018/05/21
8140
【数据科学】需求高涨的数据科学家
从技术方面来看,硬盘价格下降,NoSQL数据库等技术的出现,使得和过去相比,大量数据能够以廉价高效的方式进行存储。此外,像Hadoop这样能够在通用性服务器上工作的分布式处理技术的出现,也使得对庞大的非结构化数据进行统计处理的工作比以往更快速且更廉价。 然而,就算所拥有的工具再完美,它本身是不可能让数据产生价值的。接下来我们还需要能够运用这些工具的人才,他们能够从堆积如山的大量数据中找到金矿,并将数据的价值以易懂的形式传达给决策者,最终得以在业务上实现。具备这些技能的人才,就是在大数据浪潮如火如荼的美国目前
陆勤_数据人网
2018/02/27
1.1K0
推荐阅读
相关推荐
数据科学家 (Data Scientist) 的核心技能是什么?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档