前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >数据分析师职业发展白皮书(2015版)第一——三部分

数据分析师职业发展白皮书(2015版)第一——三部分

作者头像
小莹莹
发布2018-04-20 18:44:02
1.3K0
发布2018-04-20 18:44:02
举报
文章被收录于专栏:PPV课数据科学社区

数据分析师职业发展白皮书(2015版)

目 录

一、是技术也是艺术——CDA研究院和业界前沿公司和对数据分析的认识

二、数据分析师职业发展历程

1.国外数据分析行业发展历程

2.国内数据分析师职业发展

三、数据分析师人才行业现状

1.人才模型/岗位划分

2.国内数据分析师人才薪资水平

3.国内数据分析师人才分布

4.国内数据分析师人才需求

四、数据分析师人才职业规划

1.目前人才职业现状

2.数据分析人才学习路径

3.总结

五、CDA数据分析师培训及认证

1.考试简介

2.为什么选择CDA等级认证考试?

3.如何成为一名CDA数据分析师?

4.人大经济论坛CDA优势

六、数据分析师行业发展前景

1.优势、劣势

2.展望

七、数据分析师行业对《促进大数据发展行动纲要》的响应

1.知识分享氛围的培养

2.人才培养体系的建立

3.从业人员自律文化的形成

八、附录

附录1. 经管之家(原人大经济论坛)发展历程

附录2. 国内重要大数据相关政策行动梳理

一、是技术也是艺术——CDA 研究院和业界前沿公司对数据分析的认识

数据是指以时间为轴,记录人物、地点、事件和方法等生活各个维度的数字字符。数据会随着时间不断累积,也会随着科技、生活观念等变化而呈现出不同的特性。消费者去商场用现金支付的方式购买了一件心仪的衣服,商店的日销售报告中记录了此次交易的金额、数量、款式和型号。当消费者采用的是刷卡的支付方式时,银行的日流水单以及商店的 Pose 机刷卡记录就产生了一笔时时交易数据。如果该消费者还是这家商店的会员,那么该商店就拥有了该消费者部分基本信息以及多次购买产品的交易记录。 随着互联网、自动化科技的发展, 消费者更多的参与了 线上交易,那么线上交易平台会产生消费者常用地址、联系方式、 偏好产品、产品型号、消费额度和消费频率等全面而及时地消费数据。

在传统的商业和社会环境下,人们对于数据的利用是非常有限的。企业和商家们利用自身的营销数据汇编成财务报告、信息披露报告,用来为管理层或者潜在投资者?供企业经营状况的参考资料。政府各个机构拥有的人口、宏观指标、地区发展、部门业务发展等各方面的数据为定期政府报告等特定事项提供数据服务。数据成为我们衡量过去发展状况和业绩水平的一种度量衡。 传统意义上对于数据利用存在的缺失是不可忽视的。

首先,传统意义上对于数据的利用形成了无数个数据孤岛。宏观数据、调研数据、社会化数据和企业数据之间存在数据孤岛,而政府内部和企业内部同样存在数据孤岛。 各个政府部门、甚至每个政府部门内部都有自身因专门的业务内容而产生专项数据,但是这些专项数据仅仅在服从专项需求时才被局部调用。企业内部也是这样,除了必要的信息披露之外,企业各部门之间的数据也是缺乏协同和共享机制的。数据孤岛的存在比我们想象得还要多而广泛,也极大地降低了对数据的利用。

其次,传统数据存在缺失和错误的比率较大。商务系统和互联网尚未发展的情况下,企业和社会运营的数据很多是通过人工的方式进行记录的,因此就很容易存在数据缺失和数据失实的情况。更重要的是,很多数据的产生需要大量的人力、物力去完成,在不可估量商业价值的情况下,数据的累积往往具有很强的延时性。

再次,数据的价值被低估, 缺乏专业的数据分析人员对数据的商业和社会价值进行分析。我们会发现,传统意义上的数据管理是基于某些特定的目的和需求,例如定期的信息披露,盈余管理和预测等。但是这些目的和需求都不是为了能够创造价值而设立的,更多的是一种业务和管理层面的辅助。在缺乏商业利益动机的前提下,也就没有专业数据分析师存在的必要。

近两年国内 市场对数据分析师职位的需求逐步涌现。 根据猎聘网数据显示,全国中高端职位中数据分析师职位由 2014 年初的 200 多个职位逐步增长到接近 3000 个职位,数据分析师职位无论从绝对数到相对数量而言都出现了快速增长的态势。就地区发展而言,数据分析师职位主要分布在北京、上海、杭州、深圳和广州的一线城市,二线城市目前对于数据分析师的需求相对滞后。分析师职位主要集中在互联网、金融、消费品、制药和医疗等行业,其中互联网和金融行业的分析师职位数超过了 80%。 目前数据分析师的薪酬水平高于行业平均水平,体现出数据分析师以及数据的价值正在逐渐被市场所认可。

数据分析师职位的大量涌现和对数据分析师市场价值的认可主要是基于数据分析3.0时代的到来。1954-2005年,电脑设备广泛应用,数据库的初步形成;2005-2013年,互联网蓬勃发展,互联网公司为了解决自身数据量较大、数据复杂的问题引入了解决数据问题的分析工具;2013 年至今, 传统行业开始引入互联网行业中运用的数据分析方法,数据分析3.0时代开启。2013年至今,数据相关企业迅速发展,包括为数据?供分析、服务、软件和硬件相关的商业化和开源公司。鉴于互联网行业对于大数据分析成功的经验,市场开始重视数据和数据分析对创造商业价值的重大潜力。

大数据时代我们拥有的数据是足够大的。在互联网的世界里,每分钟 Facebook平均有600次的访问量,并有新增用户28万;Amazon 每分钟销售高达8.3万美元;全球 IP 网一分钟能够传输639TB的数据;你需要花费5年的时间才能看完互联网上一秒钟传输的视频。同时,大数据时代的数据开始逐步走向多元化的趋势。 数据来源包括移动数据、店面交易、网络行为、定位信息、电商、用户调查、社会网络以及企业CRM 等。大数据时代可视化趋势明显,开始重视展示数据的在线动态模式以及分布形态。 数据可视化是一种新的数据分析手段、一种叙事手段,并且包含了思考和批判的思维。通过数据可视化的方式,我们能够探查数据之间的关联。随着技术的发展,可视化将推动数据时时动态,以及自动化更新和发布的发展。

但是无论数据的形态和体量发生了何种变化,缺乏数据分析的数据本身是不具备商业价值的。数据分析能够为大数据时代带来质的飞跃。SAS 公司将数据分析分为了八个等级,分别是常规报表、查询、多维分析、警报、统计分析、预报、预测建模和优化。常规报表、查询、多维分析、警报,这数据分析的前四个等级都只能展示已经发生的历史状况,但是数据分析不仅仅如此。 统计分析能够帮助我们找到触发事件发生的相关因素、 确认最为有效的潜在交易方案。 预报可以告诉我们未来股市预期变动或者是企业未来盈利水平预期。 预测建模可以帮助金融机构预测新的金融产品的潜在客户。 运筹优化能够帮助企业在限定的条件下把握最优的业务机会。

数据分析的核心思路就是要与实际业务、商业目的和运营目标相结合,进而为社会、经济和个体创造价值。 数据分析与业务流程相结合可以体现为五个基本步骤,包括认知、运营、交互、销售和维护。商业运营要与数据分析的关键指标紧密联系,用数据提高产品市场营销效率和推广效率。大数据的维护和累积能够为商业运营描绘完整的企业画像、客户画像。大数据画像包括了了解企业或者客户的基本信息、需求倾向、用户行为等等。通过追踪核心的数据指标,进一步完善企业或者客户画像,进而将其转化成为产品元素和营销战略。通过数据分析,我们可以知道通过什么渠道、以最小的成本将竞争对手的客户 转化为自身的客户, 进而创造营业收益。 通过大数据与运营维护的结合可以很大程度上提高客户满意度,降低客户的流失率。

目前数据分析实践的运用主要体现在物联网、定位服务、客户制成以及反欺诈领域。首先是物联网领域。以 UPS 为例, UPS 每天通过 5 万台快递车派送约 1630 万个包括。 UPS 在每台快递车上都安装了传感器,并且通过传感器传输数据分析,制定每天每台车少跑一英里的运营战略,该战略为 UPS 每年实现了约 3000 完美元的盈利。其次是定位服务。以美洲银行为例,美洲银行为其客户?供汉堡王的优惠券。该优惠券以美洲银行客户刷卡记录数据为基础,判断汉堡王潜在竞争对手的客户,并对这些客户进行了定向、定位的优惠券推送。该项营销战略既维护了美洲银行客户,也为汉堡王实现了创收。再次是客户支撑。通过文本挖掘、自然语言处理、情感分析等手段,对客户评论、客户投诉、海外舆情、媒体报道数据进行分类处理, 进而充分掌握客户潜在的需求,达到及时有效维护客户的商业目的。最后是反欺诈领域。最典型的例子就是保险公司骗保。我们都过神经网络分析等多元的数据分析方法及时识别和判断已有的欺诈模式和潜在的欺诈人群,进而有效的进行客户管理,确保企业运营和效益。

在传统的数据分析模式下,我们通常是先提出假设检验,后带着问题去进行数据分析。在大数据时代下,我们更重要的是关注小数据完善和收集的同时,构建完善的数据交互平台。在先有数据的基础上,在数据中找寻新的思路和创新机遇,进而实现价值的飞跃。在数据爆炸和新媒体时代的背景下, 文字、图片、 视频、 网络数据等新兴的数据模式使得我们需要掌握和运用全新的数据处理方式。 同时, 我们还需要对数据进行生命周期的管理, 对非结构数据进行筛选和标签化。数据分析看重的是数据的多元性和数据的质量,我们需要构建起大数据谱系, 同时结合数据的特性采用不同的数据分析方法、分析工具和分析模型。因此,数据分析需要较为综合的思维和能力。

综上可知,数据分析是一门技术也是一门艺术,数据分析起源于生活,也为生活创造着新的价值。 从事数据分析师需要累计多元化的知识和素质,包括统计学、机器学习、工程、可视化、深刻行业知识、强数据库能力,炼精炼信息的能力、运筹学等。数据分析师还需要具备怀疑态度以及创造能力,才能将数据的技术和艺术相结合,使得数据分析能够业务相结合,更加贴近我们的生活。 多元化的学识背景以及对于生活的感知能够造就一名优秀的数据分析师。 大数据时代已经来临,数据分析行业的急速扩展必然给数据分析师们带来广阔的发展空间。数据分析师是一门需要掌握多元数据分析技术,是拥有生活感知、经济分析能力的高端人才就业岗位。

目前,数据分析师行业仍然处于发展的初期阶段,也就存在着发展初期必然有的一些问题。数据分析整体的发展区域集中在几个少数的一线城市,发展和就业机会相对还是比较有限的。数据孤岛仍然在很大程度上未被消除,需要政府和政策上进一步对此进行扶持和推动。数据分析全自动化流程尚未形成,半自动化的数据环境下,数据分析还是存在时间延迟和残缺等一系列的问题。 上述几个方面都需要政府相关部门、行业领军人物以及数据分析浪潮的每个参与者共同努力。

二、 数据分析师职业发展历程

数据分析师,是指在互联网、金融、电信、医疗、旅游、零售等多个行业专门从事数据的采集、清洗、处理、分析,能够利用统计数 据、定量分析和信息建模等技术制作业务报告、进行行业研究、评估和预测,从而为企业或所在部门提供商业决策的新型数据分析人才。

1. 国外数据分析行业发展历程

2015 年 2 月 ,美国白宫正式命名DJ Patil担任首席数据科学家和制定数据策略的副首席技术官。 DJ Patil曾在LinkedIn、 eBay、 PayPal、 Skype和风险投资公司Greylock Partners等诸多硅谷知名公司工作过,积累了丰富的经验,在上任之后将会扮演负责政府大数据应用开发专家的角色,尤其是针对奥巴马的医疗改革方案。美国政府正在用实际行动告诉全世界, 其已经意识到要充分利用其他们的数据。

IDC(互联网数据中心)预测,目前每年数据的生产量是8ZB,2020 年将达到40ZB。属于大数据的时代已经到来。

图 1. 全球数据年产量

数据生产量“ 拐点” 已至,将开始爆发式增长。我们正处在一个数据量爆发增长的时代,当今的信息产业呈现出前所未有的繁荣,新的互联网技术不断涌现,从传统互联网的PC终端,到移动互联网的智能手机,再到物联网传感器,技术革新使数据生产能力呈指数级提升。

在欧美日等发达国家,数据分析行业不仅仅在企业的运营管理中起到举足轻重的作用,也在政府的社会治理等方面发挥着重要作用。2012年的美国总统的大选中,奥巴马就利用数据分析武器,来了解不同选民的需求,设计并策划合理有效的“自我营销”亊件,最终在选举中击败劲敌罗姆尼赢得违任,此案已经传为“数据分析”致胜的佳话。

数据分析行业在发达国家,不仅仅在企业中有大量的从业人员,并且发展出很多具有规模的专业性服务机构。这些专业的服务机构有的来源于信息技术公司,如 IBM、惠普、微软;有的则来自数据库软件公司,如甲骨文;更有的来自传统行业如亚马逊、沃尔玛;当然也有一些新兴的专业咨询企业,在投资公司和私募基金的资金支持下,获得飞速的发展,如: Mu Sigma, TeraData 等。其中美国有近万家专门从事数据分析的服务公司,年营业额达到几千亿美元,英国有三千多家,日本有一千多家,瑞典也有五百多家有影响的数据分析服务公司。

从数据分析师职业来看,数据分析行业在国外从业人群众多。在美国,几乎所有大中型企业里都有专业的数据分析人才从事相关的数据分析工作,数量有数百万之多,日本有十五万多,瑞典也有十万多名数据分析专业技术人员。数据分析高端人才的需求这几年仍在迅速扩张和增加,数据分析人才的供应量远远赶不上需求量,缺口很大。

IDC(互联网数据中心)发布预测报告称,2017年大数据技术和服务市场将增至324 亿美元,实现 27%的年复合增长率。此外还预测基于大数据的决策解决方案将开始取代或影响知识工作者角色,这势必引发人才转型。

2. 国内数据分析师职业发展

数据分析行业在国外历史已久,伴随着互联网技术、信息技术、通信技术的发展,目前已经非常成熟,并远远领先国内的发展水平,据估计,这一差距至少要有5-10年。

自改革开放以来,随着国内经济的快速发展以及在各大行业与国际接轨的步伐不断扩大,国内的数据分析行业从 2003 年开始觉醒和渐热,如今已经过 12 年的发展。这期间数据科学相关职业从少到多、认证协会从无到有、数据分析挖掘工作从模糊到清晰。如今,中国的数据分析行业经过十多年的磨砺,正迎来辉煌灿烂的井喷式发展期。

2004 年至 2006 年是数据分析行业的起步阶段;从 2006 年到 2010 年,数据分析行业已经全面成型,相关的培养方案和课程体系进一步完善,全国性行业协会的申请工作正式开展。我国数据分析师人数从零起步,猛增至近万人。数据人才的分布领域也从最初的分析评估业和金融业,迅速扩展到会计师、投融资机构、政府审批和企业管理等众多领域,涉及的行业从银行保险等金融行业到分析服务业、制药业、石油和天燃气行业以及 IT 行业,数据分析师迅速成为国内炙手可热的职业之一。

2011 年,“云计算”的概念风靡世界,并开始在全国推广,国内一些大型互联网公司如阿里巴巴等建成了一大批以“云计算技术”和“云存储技术”为概念的“云计算中心”,并投资开发多个开发区。这为数据采集后的存储、处理、传输和分析提供了基础。数据分析师职业有了更加具体的应用方向。

自2012年开始,“大数据”一词横空出世,国外的一些行业领导者开始提出“大数据时代”的概念。“大数据”一开始就不止步于理论,它对大量和复杂数据的处理,在技术上提出了新的拓展思路和方向。随着互联网技术的提速、第四代移动互联网的广泛应用、社交媒体的移动化,各行各业在数据的内容、结构、复杂程度和数量方面都呈现出几何倍增的特征。很多企业的数据分析师对如何更好地利用海量数据为政府管理、企业运营等决策提供了科学的依据。这也为“数据分析师”这一职业的快速发展开拓了巨大的空间。 CSDN 的一项调查报告指出,国内的大数据应用目前多集中在互联网领域,并且有超过 56%的企业在筹备和发展大数据研究。未来5年,94%的公司都需要数据分析专业人才。

埃森哲一项分析报告曾指出,数据分析人才价值倍增的原因在于业务分析法已经从企业的辅助角色跃升至核心地位,并能够帮助企业制定许多重要的决策和流程。对处于这一发展趋势最前沿的互联网行业而言,分析法已经成为一项企业战略性能力。即便是在分析法仍处于起步阶段的电子和高科技等行业,分析人才也是企业未来高速发展的关键所在。在报告中,在所调查的包括分析服务业、银行业、石油天然气行业、通信技术行业等七大传统行业内,新增的数据分析就业机会在中国的发展速度仅次于美国,在2015年将增加30500人, 74%的新增数据分析专家工作将会出现在中国、印度和巴西;尽管美国提供供了最多的数据分析就业机会,但是,中国、印度和巴西的数据分析职业发展速度更快,并且只需要短短十年,中国和印度就将在这些行业中雇用近一半的数据分析人才。

图 2. 数据分析相关人才职位数调查预测

不难看出,美国提供了最多的数据分析相关人才就业机会,但是中国、印度和巴西的相关职位发展速度更快。

如今,我们已经进入了企业发展日新月异的“互联网+”时代---一个用数据说话的时代,也是一个依靠数据竞争的时代。目前在世界 500 强企业中,有 90%以上都建立了数据分析部门。 IBM、微软、 Google 等知名巨头公司都在积极投资数据业务、建立数据部门、培养数据分析团队。各国政府和越来越多的企业意识到数据和信息已经成为企业的智力资产和资源,数据的分析和处理能力正在成为企业日益倚重的技术手段。我国在互联网行业热钱涌动的又一波浪潮下,对数据分析方面人才的需求更加迫切,培养力度更是空前。

三、 数据分析师人才行业现状

1. 人才模型/岗位划分

在国内,大数据的应用才刚刚发芽,人才市场还不那么成熟。很多公司根据已有的资源和短板,招聘能和现在团队互补的人才。有的强调统计学知识,有的突出数据库操作,有的要求算法编程经验,有的则要求有咨询公司或者投资银行相关的经验,所以“职称”众多,诸如数据分析师、数据挖掘工程师、大数据分析师、数据工程师等。

针对 SAS、 Tableau、 钱方银通、民生银行、和堂科技、星图数据等公司 的调研,我们了解到:一些大的互联网、金融等公司,及专门的数据公司均设有数据部门,

部门拥有完整的数据采集、数据存储、数据分析挖掘、数据可视化等整套体系。而一般的企业多数只需要数据分析师,提供决策辅助和咨询。所以,繁多的“职称”背后,万变不离其宗的是数据相关职位的职能,按照职能我们可以分为四类,对应的专业和职责如表 1 所示:

职业

专业要求

岗位主要职责

[1].数据分析师

统计学,数学,计算机,信息管理

运用工具,提取、分析、呈现数据,实现数据的商业意义

[2].数据挖掘工程师

计算机,数学,统计学

机器学习,算法实现

[3].数据工程师

计算机,数学,统计学

开发运用简单数据工具,实现数据建模等功能,对业务有较好理解

[4].数据科学家

计算机,数学,统计学

高级算法设计与优化,数据相关系统设计与优化,对行业有较深的理解

表 1. 数据分析相关人才职位表

1.1 数据分析师相关职位:

首先,来看下数据分析师的情况。这个职位的主要技能是[1](数据分析) ,附带[2](数据挖掘) ,有少量的[3](运用已有工具建模) 的需求。因为企业对这个职位的要求是作为业务部门的参考与辅助,因此希望是多面手。“职位”包括数据分析专员 /分析师、数据运营主管等

数据分析师招聘要求样本如下:

样本一(美团网) :

招聘岗位:数据分析专员

工作经验: 1-3 年

月薪范围:¥6000-8000

学历要求:本科及以上

岗位职责:负责移动平台产品的日常数据统计、整理,为产品运营?供日常数据支持;负责移动平台产品数据分析,定期完成日、周、月、季报等数据报告工作;负责产品数据分析与数据挖掘的分析体系的构建;负责用户调研、及用户行为分析等数据商业价值挖掘工作;负责数据统计平台的维护、优化、升级

岗位要求:本科及以上学历,统计学、应用数学相关专业优先考虑;一年以上互联网数据分析经验(移动互联网优先);具备一定的文档能力,能够独立完成数据分析报告的撰写;具有一定的数据挖掘、数据建模能力,能够熟练使用统计工具软件者优先;熟练使用 Excel、 PPT 以及相关办公软件

样本二(京东金融):

招聘岗位:数据分析师

工作经验: 3-5 年

月薪范围:¥15000-30000

学历要求:本科及以上

岗位职责:分析与设计业务风险控制规则,建立风险识别、监控与预警机制;建立风险监测指标体系,对业务线进行日常监测与运营分析,提供运营分析报告;对可疑交易/账户进行预警分析与问题定位,提供有价值的结果,提高运营有效性;建设业务相关的数据库表,并能固化到指定的数据库中,提高查询效率;建立针对欺诈行为的风险管理策略,构建欺诈行为识别与侦测机制;将研究成果转化成风控规则并跟进落实,协调产品、研发、运营团队,推动风控规则与风险模型的实施。最终部署在控制决策系统中;其他工作,参与完成各类分析报告、报表等其他指定的工作

岗位要求:本科及以上学历,数学、统计、计量经济学、金融等相关专业优先; 3年以上相关工作岗位经验,具有支付机构、金融机构、风险管理相关经验者优先;能够熟练使用 Hive、 SQL、 R、 SAS、 SPSS 及其他数据查询统计软件者优先;曾经参与过完整的数据采集、整理、分析工作;具有一定的交易风险规则设计、风险模型开发经验;精通 Excel、 PPT、 WORD 等办公软件;具备较强的数据分析能力、逻辑思维能力、对内外组织沟通能力、执行能力和团队精神;有诚信、愿意分享和承担责任,勇于探索与坚持创新。

1. 2 数据挖掘相关职位:

数据挖掘相关岗位更多的分布在一线城市互联网、 金融行业,合格的数据挖掘工程师通常需要有 3 年以上工作经验,主要技能为[2](数据挖掘) ,有少量的[3](运用已有工具建模) 。

相关招聘要求样本如下:

样本一(人人车):

招聘岗位:数据挖掘

工作经验: 1-3 年

月薪范围:¥15000-30000

学历要求:本科及以上

岗位职责:负责人人车数据挖掘的算法改进及策略研发;通过数据挖掘、机器学习等方法,深刻理解数据本质,进行核心策略的研究及开发;参与和负责数据仓库基础设施和平台的搭建、开发及维护工作;优化数据存储和计算平台,确保数据平台的可靠运行

岗位要求:具有较强分析问题和解决问题能力、良好的团队合作意识、沟通能力;熟练掌握数据挖掘、机器学习相关算法及工具;熟练使用 Linux 系统,具有非常扎实的数据结构和算法基础,至少会写一门脚本语言;有文本分析、自然语言处理或者大数据分析工作经验优先

样本二(百度):

招聘岗位:数据挖掘

工作经验: 3-5 年

月薪范围:¥20000-40000

学历要求:硕士及以上

岗位职责:针对百度知识系产品,开展数据挖掘、文本分析、用户行为建模等工作;深化用户与内容分类,属性挖掘以及体系建设;整体?高产品的用户体验;跟进业界相关技术进展并进行策略技术到产品的落地

岗位要求:计算机或相关专业硕士以上学历;良好的逻辑思维能力,能够从海量数据中发现有价值的规律;良好的团队合作精神,敢于接受挑战;精通C\C++,PHP,PYTHON 等至少一门常用语言,对数据结构和算法设计有较为深刻的理解;熟悉大规模数据挖掘、机器学习、自然语言处理、分布式计算等相关技术,并具备实际工作经验;具有互联网公司内容挖掘、推荐、检索相关工作经验者优先

1.3 数据工程师相关职位:

数据工程师的相关职位名称相对较多一些。但是总结起来,都是在已有平台和工具的基础上实现开发和运用。大部分我们见到的“数据**师”其实都归属此类。技能要求为[3](运用已有工具建模) ,其次是[1](数据分析) 和[2](数据挖掘) 。以最常见的职称——数据工程师为例。

相关招聘要求样本如下:

样本一(广发证券):

招聘岗位:数据开发工程师

工作经验: 3-5 年

1月薪范围:¥20000-30000

学历要求:本科及以上

岗位职责:对公司的基础数据层进行规划、梳理、优化与扩展性开发,范围涵盖所有业务数据;公司内外数据的汇集开发、基础数据层的持续开发与完善;各类业务项目的数据支撑开发、各类数据集市的开发。

岗位要求:计算机、应用数学、数据科学等相关专业;有大型数据仓库的规划/开发/分析经验,熟悉金融数据体系架构,有丰富的数据建模实践经验;技术上精通关系数据理论、深刻掌握 SQL 及相关技术,对企业数据模型有深刻的认知和理解;至少掌握: Java、 Python、 Perl 等一门编程语言;能够积极创新, 乐于面对挑战, 勇于承担工作压力;优秀的团队合作精神;诚实, 勤奋, 严谨,敬业。

样本二(人人车):

招聘岗位:数据开发工程师

工作经验: 5-10 年

月薪范围:¥20000-30000

学历要求:本科及以上

岗位职责:负责业务数据分析和数据模型设计,设计实现关系型数据库、数据仓库、实时数据库、内存数据库、分布式数据库和分布式文件系统等存储方案,构造最优的数据库模式,负责设计、评估及审核,主导开发和实施;与业务方沟通,用数据支持业务,改善运营

岗位要求:超过 5 年以上的数据模型分析设计、数据仓库建设和数据集成经验;熟悉大型互联网产品的架构,对大数据量的互联网产品有丰富经验,熟悉大规模数据处理的机制和框架;强 coding 能力;强工程实践经验;熟悉 MySQL 等关系数据库。

1.4 数据科学家相关职位:

最后我们来看看数据科学家,这是整个数据产业上的顶端职位。这个职位,要求是[4] (软件工程技能在多数统计学家之上;高级算法设计与优化;数据相关系统设计与优化;需要有垂直行业经验) 。既要懂行业,又要技术资历(最少 3 年,一般 5-10年),该职位相对上述三种职位来说需求量相对较小,但是空缺量巨大。

企业的招聘要求样本如下:

样本一(某知名电商):

招聘岗位:数据科学家

工作经验: 5 年以上

年薪范围:¥500000-700000

学历要求:博士

岗位职责: 规划和管理全公司数据使用,指导数据工程师构建数据仓库、分析流程和应用。基于分布式计算系统,处理和分析 PB 级别移动互联网数据; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 支持数据的对外发布和合作

岗位要求: 2 年以上数据相关工作经验 ; 热爱数据工作,相信数据的价值; 扎实的计算机和数学背景,有机器学习基础优先; 具有较好的商业敏感度,深入理解数据处理过程和业务场景; 熟练掌握至少一门编程语言,具备分布式计算系统( Hadoop/Spark)开发经验 ; 擅长与商业伙伴的交流沟通,具有优秀的跨部门协调和沟通能力; 优秀的合作精神和团队管理能力

样本二(某大型互联网金融公司):

招聘岗位:数据科学家

工作经验: 5 年以上

年薪范围:¥600000-900000

学历要求:硕士及以上

岗位职责: 根据具体业务和产品对数据模型进行统一分析和规划; 深入理解产品业务的方向和战略,通过数据分析、 挖掘,为产品和运营?供决策支持; 应用统计建模和机器学习方法建立模型解决实际问题; 与业务部门沟通合作,将数据模型应用于实际业务; 指导数据工程师、分析流程和应用

岗位要求: 研究生以上学历; 扎实的计算机和机器学习背景; 熟练掌握 Python或 Java 等语言; 具有商业敏感度; 深入理解数据处理过程和业务场景; 5 年以上工作经验

综上所述,数据相关的职位,指向的是数据采集、数据分析、数据挖掘、数据结构四大技能,即使初级职位,要求也是一专多能。高级职位则要求每个模块都有理解,对统计、编程、行业理解都要求很高。对分布式系统原理有较深的理解,理解数据库相关理论及操作;有数据分析和挖掘经验者优先,有在互联网公司或海量数据处理工作经验,有系统开发经验者优先。

2. 国内数据分析师人才薪资水平

2.1 不同岗位薪资水平比较

从上面的人才结构中,我们大体可以看出数据科学相关人才的薪资待遇平均水平对于其他行来说是较高的。下面我们根据过去几年的统计观察, 得到不同岗位的薪资水平, 如下:

图 3. 不同岗位薪资

上图显示,在全国范围内 ,数据分析师的平均薪资大约为8100元,数据挖掘工程师的平均薪资为13900元,数据工程师的平均薪资为13700元,而数据科学家的平均薪资为42000元。

智联招聘在 2015 年春季发布的《2015 年春季中国雇主需求与白领人才供给报告》中列出了2015年春季求职期十大高薪职业, 其中前三名分别是高级管理、 IT管理/项目协调、证券/期货/投资管理/服务,对应薪资分别为13555元、 9450元、 8085元。由此可见,数据分析师岗位的平均薪资排在十大高薪职位里面的上游水平。未来10年,互联网将在中国 GDP 增长总量中贡献 7%到 22%,而移动设备、云计算、自带设备办公、 SNS、大数据将推动整个行业。大数据分析和预测技术人才备受追捧,云计算、可穿戴设备领域人才需求变热。不仅仅是薪水, 互联网企业员工持股计划提速,更多企业强化长期激励及个性化的福利,而传统 IT 领域相对式微。

与此同时, 薪资水平随时间的变化如下图:

图 4. 数据相关岗位薪资变化

可以看出, 近几年数据相关岗位平均薪资的变化。不难看出,2012 年之前,数据相关岗位平均薪资较低,在 6800-8500 之间, 而且每年增长幅度不大。2012年,维克托迈尔舍恩伯的书籍《大数据时代》一书的出版, 标志大数据时代的到来,大数据的概念也是从2012年开始火热起来, 更多企业开始意识到数据分析对于企业决策的重要性, 企业对于相关人才需求增加,相应的薪资待遇也逐年增加, 且增加幅度相对之前几年较高。

2.2 薪资水平的不同维度比较

2.2.1 薪资水平与工作经验的关系

O’Reilly Media 公司在报告《2014 Data Science Salary Survey》 中指处,根据他们的模型预测,数据相关职位每积累一年的工作经验,年薪将会增加1400美元左右;对于数据分析师和数据工程师而言, 即使没有技术等方面的改变,该模型预计他们每年的工资也会增加 2500 美元左右。

在国内 ,数据相关职位薪资亦会随工作年限的关系,如下图:

图 5. 数据相关职位月薪与工作经验关系

数据相关职位会随着工作年限的增加而增加,而且工作经验越丰富,在进入下一阶段时的薪资涨幅越大。数据分析专员 一般要求1-3年工作经验,数据分析师、 数据挖掘工程师及数据工程师一般要求3年以上工作经验,而数据科学家则要求5年以上经验。

2.2.2 不同应用工具的价值体现

事实上,不止现在数据工程师需求缺口严重,根据国外的情况,未来这块仍有很大缺口 。美国人才招聘市场的数据分析领先者 Wanted Analytics 最近的报告指出,过去几年大数据相关工作岗位上需求增长最快的三项技能分别是:Python, Linux 和SQL。

反观国内 ,根据我们做过的一项调查了解到,在数据科学相关工具(包括但不限于: 统计学软件、编程语言、 BI 商业应用、 数据库、大数据平台、可视化软件、 操作系统)中,使用率最高的 10 种工具是 Windows、 SQL、 Excel、 SPSS、 SAS、 Python、 R、Linux、 Java、 Hadoop。

然而,薪资最高的 5 种工具中, 有四种是大数据相关平台,分别是 Hbase、 Spark、Pig、 Hadoop,这四种平台使用者的平均月薪在 13500 元以上; 我们分析,大数据从业者作为数据科学领域的前沿实践者, 在数据科学领域拥有较强的知识基础、经验与能力,通过不断的学习来?高自己的技术水平,走在领域的前沿,所以相应的也会获得一份较高的薪水;而 R 软件由于经常用于数据挖掘工作, 所以所对应的使用者的平均薪资也是较高,平均在 10000 元以上。

图 6. 从业者薪资与使用工具的关系

3. 国内数据分析师人才分布

易观智库在针对大数据市场行业的一项研究报告显示,2014年中国大数据市场行业投资结构中,金融、通信、零售为前三大行业,投资占比分别为 16.0%、 15.6%和 13.9%。

政府、医疗、旅游投资比例分别为 12.7%、 9.0%和 4.1%。六大行业占比 71.3%。其他行业包括教育、制造、能源、媒体、互联网等,累计占比 28.7%。

图 7.2014 年中国大数据市场行业应收结构

不过,数据科学相关工作岗位集中分布在金融、互联网、通信三大行业,三大行业提供了近 60%的岗位。尤其是金融和互联网行业, 前者银行、互联网金融类公司对于数据科学相关岗位的需求最多;而后者则由于积累了大量数据,更多价值信息等待挖掘,所以对于数据科学相关人才有很大的需求,对应的人才分布相对较多。

在已统计的数据相关企业中,北京、上海、广东( 主要是深圳) 和浙江( 主要是杭州) 的占比达 92%,其中北京处于遥遥领先的地位,全国占比接近 60%;在北京的大数据企业或产品中,海淀区又占有绝对的优势地位,占北京大数据企业的 63%,在全国来看占比在三分之一左右。

图 8. 大数据企业地区分布

包括百度、阿里巴巴、腾讯在内的很多互联网公司及数据相关企业分布在北京、上海、 深圳、 杭州等地, 在很大层面上决定这些省份城市的数据相关人才分布较为集中。

4. 国内数据分析师人才需求

埃森哲的之前的一份报告预测, 2010 年至 2015 年,在发展中国家,分析类专业服务和制药业将创造出最多的数据科学相关就业机会。而在发达经济体中,保险和银行业提供最多的数据科学相关职位。

图 9.2010-2015 年新增数据科学相关就业机会在调查所覆盖各国的分布情况

(注: 黄色的单元格代表了 每个国家新增数据科学相关职位占比最高的行业)

目前看来,在未来五年,互联网、金融及医疗行业将会创造大多数的数据科学相关职位。互联网行业将积累大量的数据,传统金融行业转型面临巨大的数据科学相关职位的缺口;对于医疗行业来说“ 3521 工程”,即建设国家级、省级和地市级三级卫生信息平台,加强公共卫生、医疗服务、新农合、基本药物制度、综合管理 5 项业务应用,建设健康档案和电子病历 2 个基础数据库和 1 个专用网络建设,当前全国有数十个个省份在搭建省级的信息化平台、 100 多个城市在不同程度上搭建市级平台,以及区域医疗建设和医联体等,都会积累大量的数据,而且未来利用大数据解决医疗问题是面临的急需解决的问题。

根据对阿里巴巴、星图数据、钱方银通、和堂金融等公司的访谈及调研,并根据这些数据做出的预测显示,到 2018 年,数据分析师的职位空缺将达到近40000人,而且各行各业均会对数据科学相关岗位产生很大的需求。

1、回复“数据分析师”查看数据分析师系列文章

2、回复“案例”查看大数据案例系列文章

3、回复“征信”查看相关征信的系列文章

4、回复“可视化”查看可视化专题系列文章

5、回复“SPPS”查看SPSS系列文章

6、回复“答案”查看hadoop面试题题目及答案

7、回复“爱情”查看大数据与爱情的故事

8、回复“笑话”查看大数据系列笑话

9、回复“大数据1、大数据2、大数据3、大数据4”查看大数据历史机遇连载

PPV课大数据ID: ppvke123 (长按可复制)

大数据人才的摇篮!专注大数据行业人才的培养。每日一课,大数据(EXCEL、SAS、SPSS、Hadoop、CDA)视频课程。大数据资讯,每日分享!数据咖—PPV课数据爱好者俱乐部!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2015-10-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档