Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >数据分析师还是算法工程师|用数据多角度解读如何选择

数据分析师还是算法工程师|用数据多角度解读如何选择

作者头像
刘早起
发布于 2020-04-22 08:50:36
发布于 2020-04-22 08:50:36
1.3K00
代码可运行
举报
文章被收录于专栏:早起Python早起Python
运行总次数:0
代码可运行

前言

疫情即将散去,又到了求职季。学习Python的各位该如何选择自己的职业方向,算法工程师还是数据分析师?跟随本文一起看看吧!

01

数据获取与处理

本次样本数据采集于拉勾网,因为本文的重点是招聘数据分析,而在之前的文章中我们讲解过很多次如何使用requests爬取网页数据,这里就不再赘述,来看下爬取网站部分代码

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
url_html = 'https://www.lagou.com/jobs/list_' + job_position + '?labelWords=&fromSearch=true&suginput='  
params = {
            'city': job_address,
            'first': 'true' if i == 1 else 'false',
            'pn': i,
            'kd': job_position}
 # 创建一个session对象
s = requests.Session()
# 发送请求,获得cookies
s.get(url_html, headers=headers, data=params, timeout=4)
cookie = s.cookies
res = s.post(url_request, data=params, headers=headers, cookies=cookie, timeout=4) # 注意分析网页数据获取格式
res.encoding = res.apparent_encoding
text = json.loads(res.text)

本文在拉勾网招聘信息中选择北京、上海、广州、深圳、杭州这五个城市下分别以数据分析师、算法工程师为筛选条件来采集样本,采集到的原始数据如下

当然我们在进行数据分析时不需要图中这么多变量,因此对数据进行清洗后最终样本数量为1979条,并选择以下几个变量进行分析

02

薪资水平

我们首先来看下数据分析师与算法工程师的薪资水平密度分布图,绘制出这两个岗位的薪资分布密度图并标记出薪资的均值(图中虚线)?

图中红色部分为算法工程师的薪资分布密度,蓝色部分为数据分析师的薪资分布密度,可以看出不论是数据分析师还是算法工程师,其薪资水平都是比较高的,但是算法工程师的薪资会更高一点,从两条虚线的位置可以看出算法工程师的平均薪资以29619元超过数据分析师的18841元!值得注意的是这两个岗位薪资均呈现明显的多峰形态,说明存在一类薪资相当可观的精英职位

03

企业所属行业分析

本节通过制作词云图来对发布招聘企业所属的领域/行业进行分析

上图为我们根据发布招聘信息的企业所属领域/行业的文本信息绘制的词云图,从图中可以看出数据分析师与算法工程师的行业有较大的交叉,主要都属于移动互联网、金融相关企业,但数据分析师的数据服务、电商、消费生活企业更多,而算法工程师的人工智能相关企业占比较高,所以想从事人工智能相关岗位的同学就往算法方向准备吧。

04

学历对的薪资影响

在本节,我们使用箱线图来分析学历对薪资的影响

每一个箱子的宽度代表该学历提供的工作数量,纵轴为薪资高低,从图中我们可以看出,不论是数据分析师还是算法工程师,大多数岗位面向的对象为本科生。并且可以明显看出算法工程师对学历的要求更高,数据分析师有33个岗位要求最低学历为硕士,而算法工程师要求硕士的岗位有389个,并且值得注意的是:接近1000个数据分析师岗位均无博士学历要求,而算法工程师要求博士的岗位占比高于大专。所以想要从事算法工程师相关岗位还是先努力提升学历吧。

05

技能需求分析

我们提取数据分析师与算法工程师岗位所要求的技能/语言相关信息(仅为标签中需求并未提取详细要求中技能需求),对其进行可视化?

可以看到对于数据分析师来说,需求最高的是SQL,其次是BI软件与SPSS以及HiveHadoop大数据相关,虽然也有Java等,但是总体对于编程语言需求不高,值得注意的是只有一家公司需要应聘者会使用python(用女朋友担保真的只有一家需求中含有Python)。再看右边的算法工程师,对于NLP的需求最高,其次C/C++、Python、JAVA、GO等各种编程语言都有,值得注意的是有些企业还需要求职者懂一些Linux运维相关的知识。

06

回归建模

上面的分析仅是从一些描述性分析的角度,在本节我们对影响薪资水平的各个因素进行回归建模来量化分析,由于原始变量太多存在多重共线性,因此我们选择主成分回归模型:先利用主成分分析对各个变量提取主成分,然后对变量进行中心化与薪资对数化,接着建立回归模型,最后将回归方程中的主成分转换为原始变量。

数据分析师影响因素的回归系数

算法工程师影响因素的回归系数

对比两个图可以发现,不论是数据分析师还是算法工程师都对工作经验有着较高的要求,其中算法工程师要有3-5年的工作经验才算能对薪资水平有一个“正向”的影响。其次数据分析师对SQL和Hive较高的要求而算法工程师要求的语言则是Python和C/C++,当然这只是个人因素对薪资水平的影响分析,公司层面的因素就留给感兴趣的读者去做。

07

聚类分析

在这一节我们为了更加细致地了解两个行业内部岗位的分布,我们对数据分析师与算法工程师的影响因子进行了聚类分析,对聚类结果进行总结得出这两个岗位的三个典型职位

数据分析师的三个典型职位:

  • 精英岗位:需要硕士及以上学历,工作经验5年以上,掌握多种编程语言,薪资较高
  • 高级岗位:本科以上学历,有一定工作经验,熟练掌握一门编程语言
  • 普通岗位:了解基本分析方法,了解基本软件

算法工程师的三个典型职位:

  • 精英岗位:需要硕士及以上学历,工作经验5年以上,掌握NLP、Python、GO等,薪资较高
  • 高级岗位:硕士以上学历,5年以上工作经验,熟练掌握NLP与一门编程语言
  • 普通岗位:本科以上学历,一年以上工作经验,薪资较低

08

费希尔判别分析

上面做了那么多又是主成分回归建模又是聚类就是为了本节进行判别分析,我们可以利用费希尔判别法(之前文章有讲过哦)根据求职者的条件针对上一节的三个典型职位进行判别,并代入我们的模型就能预估求职者的薪资,例如

某位求职者:

  • 想应聘数据分析师
  • 应届本科生
  • 会使用SPSS、Mysql并了解一些数据分析的方法

那么使用费希尔判别法就能判定该求职者属于数据分析师的普通岗位,并可以利用之前建立的模型预测薪资大约为5247元,但如果该求职者能学会Hive与Hadoop那么薪资将涨到7144元。

09

结束语

从结果来看数据分析师与算法工程师都属于比较高薪的岗位,这也解释了为什么这两个岗位火热的原因,虽然两个岗位有一定交叉,但还是有一定区别,比如这两个岗位所需要的编程语言不大一样。并且算法工程师需要的学历更高一点,但数据分析师对工作经验的要求没有算法工程师的要求高。所以求职者可以根据自身情况去综合考虑。作者肝出本文使用了Python(爬虫(requests)数据清洗(pandas)建模(sklearn))Echarts(绘图)R(绘图(ggplot2)密度图、箱线图、建模)SPSS(建模:主成分分析)。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-03-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 早起Python 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
我的数据分析师转型之路,从零到字节跳动数据分析师
从一个什么都不懂的小白,到现在字节跳动的数据分析师,我用了大概1年的时间,在这里想给大家分享一下我的转行经历,希望能有一些帮助。
全栈程序员站长
2022/06/29
9521
我的数据分析师转型之路,从零到字节跳动数据分析师
数据科学家、数据分析师、数据挖掘工程师、数据工程师,你分的清楚吗?
数据科学家(Data scientist)的叫法来自国外,广义上它是对从事数据分析和数据挖掘从业人员的一个泛称,它只是一个头衔,并不是一个职位。狭义上,数据科学家一般是指行业里面的领军人物和顶尖科学人才,如百度前首席数据科学家吴恩达。 在人才市场上我们通常可以看到的是后三个职位(数据分析师、数据挖掘工程师、数据工程师),接下里我们就区分一下这几个职位的相同点和不同点。首先看下企业对这三个职位的要求和描述。 职位和能力 下面是阿里对这3个职位的要求和描述: 数据分析师 岗位描述: 1、独立负责业务数
小莹莹
2018/04/19
2.1K0
数据科学家、数据分析师、数据挖掘工程师、数据工程师,你分的清楚吗?
如何拿到高薪数据分析师offer?从精准解读一篇招聘信息开始!
大家好,我是大鹏,目前是一名数据分析师,从非本专业成功转行,创立“数据团学社”“城市数据研习社”,运营数十万人社群,联合发起“城市数据团”。
IT阅读排行榜
2018/12/10
6330
如何拿到高薪数据分析师offer?从精准解读一篇招聘信息开始!
大数据开发工程师岗位分析
最近一年大数据火爆异常,各种培训班开课广告满天飞,很多做开发的朋友也想转到大数据这一行,在投递简历的时候进场被几个岗位搞迷糊,他们是大数据分析师,大数据研发工程师,大数据建模工程师,大数据挖掘工程师。我会根据前同事所在公司的相应岗位,列出岗位职责和要求,供大家借鉴。
大数据工程师-公子
2019/03/14
1.9K0
学习攻略 | 数据分析师学习路线图
数据分析师Data analyst:指熟悉相关业务,熟练搭建数据分析框架,掌握和使用相关的分析常用工具和基本的分析方法,进行数据搜集、整理、分析,针对数据分析结论给管理销售运营提供指导意义的分析意见。 数据分析师职位要求 1. 计算机、统计学、数学等相关专业本科及以上学历; 2. 具有深厚的统计学、数据挖掘知识,熟悉数据仓库和数据挖掘的相关技术,能够熟练地使用SQL; 3. 三年以上具有海量数据挖掘、分析相关项目实施的工作经验,参与过较完整的数据采集、整理、分析和建模工作; 4. 对商业和业务逻辑敏感,
小莹莹
2018/04/23
4.6K0
学习攻略 | 数据分析师学习路线图
数据分析那些事(数据分析师入门必看)
经常有网友会对数据分析方面有一些困惑,并且咨询我该怎么办?并且经常是同样的问题,所以觉得有必要对一些经典共性的问题进行整理,与大家分享,这里并非标准答案,仅作参考! 欢迎提出自己对数据方面的疑问,将在此篇将持续更新,敬请关注。 -------------------我不是完美的分割线----------------- Q1:大数据是什么? ---- 答:从海量的数据里进行撷取、管理、处理、并整理之后,获得你需要的资讯。大数据的特征归纳为4个“V”(量Volume,多样Variety,价值Valu
小莹莹
2018/04/23
3.5K0
数据分析那些事(数据分析师入门必看)
【职业】大数据岗位更看重学历还是工作经验?
回答这个问题之前还是让我们看一段PPV课网站上的一段真实对话: Q:请问从事大数据这行,硕士学历有必要么? A:oh,如果有条件,最好可以上到硕士,但不是说必须如此,大数据相关职位对行业知识和项目经验
小莹莹
2018/04/25
1.3K0
【职业】大数据岗位更看重学历还是工作经验?
洞察 | 深圳数据分析师的职业前景如何?爬完拉勾数据给你分析 (附代码和过程)
通过对局部地区某一岗位的总体分析,找出该地区该职位的职业发展前景规律。本文基于拉勾上2016年12月到2017年1月深圳地区数据分析师招聘数据,为这一行业的朋友作为参考;虽然数据略为过时,但变化也不大,规律依然适用。 在深圳 1、数据分析师主要还是开发类职业。开发类的职位,无论是市场需求还是薪资都是无可撼动的最高。 2、地区方面:如果你要在深圳找数据分析师的岗位,请去南山区,优先去科技园附近。 3、薪资方面,20K是业内中等水平; 4、学历方面,除非你直接攻读相关专业的博士,否则本科足矣; 5、技能方面:
灯塔大数据
2018/04/04
8230
洞察 | 深圳数据分析师的职业前景如何?爬完拉勾数据给你分析 (附代码和过程)
数据分析师:从事数据分析都需要学习什么?
如今,数据分析师是一个很热门的职业,薪资水平较其他职位普遍偏高。很多人也因为高薪和发展,纷纷转向数据分析师。本文我们将从企业内部数据分析架构和数据分析学习两方面来了解数据分析师是如何成长的? 一、企业内部数据分析架构 1.商业数据分析中心的组织架构形式 目前国内商业数据分析中心的架构形式大致分四种,技术型,虚拟型、战略性和分散型。 2.商业数据分析中心岗位角色 业务统计分析人员:理解企业数据,发现业务问题,开发预测模型,帮助企业更好地进行信息决策; 数据挖掘人员:知识发掘积累,需要熟悉各种数据挖掘算
企鹅号小编
2018/01/31
1.2K0
数据分析师:从事数据分析都需要学习什么?
听说数据分析师挺火,我们来数据分析一下
经常看见各种数据分析师培训的运营推荐,那么数据分析师的就业行情究竟如何?让我们用数据说话,一探究竟!
luanhz
2020/04/01
5910
没有工作经验,能应聘「数据分析师」吗?
很多同学对数据分析感兴趣,也和自己在国内做数据分析师的朋友聊过,决定未来从事数据分析方向的工作。
猴子数据分析
2022/05/19
9740
没有工作经验,能应聘「数据分析师」吗?
数据分析师最不能错过的数据是什么?
作为一名数据分析师最不能错过的数据是什么?当然是和每一位数据分析师息息相关的,决定大家是吃土还是吃面包的招聘数据。
1480
2019/05/21
6210
全网唯一!朋友开发了一个数据分析师行情大盘!
每次我都回答得很模糊,因为没有真实数据支撑我的答案。我当时就很想有一个网站可以看到数据分析师岗位数量的趋势图,现在由大厂数据科学工程师小匿独立开发的网站上线了。
小火龙说数据
2024/05/22
1790
全网唯一!朋友开发了一个数据分析师行情大盘!
从拉勾网数据看深圳数据分析师的职业前景
利用这篇文章提到的方法对拉勾爬虫,然后进行数据分析。通过对局部地区某一岗位的总体分析,找出该地区该职位的职业发展前景规律。本文基于拉勾上2016年12月到2017年1月深圳地区数据分析师招聘数据,为这
小莹莹
2018/04/24
9880
从拉勾网数据看深圳数据分析师的职业前景
报告显示 :2016互联网数据分析人才高度稀缺
当前中国互联网行业正呈现一片火爆之势,不仅依托互联网 战略成为了推动各行业创新的支柱行业,更形成了巨头大放异彩,各家百花争鸣的火热格局。因此,互联网行业也成为了炙手可热的人才聚集地。 2月4日,从全球最大的职业社交平台领英获悉,目前研发工程师、产品经理、人力资源、市场营销、运营和数据分析这六大职位是互联网行业需求最火热的。 数据分析人才高度稀缺 2月4日,领英最新发布了《2016年中国互联网最热职位人才报告》,该报告基于领英平台上约50万的中国互联网行业人才大数据(截至2015年第四季度),分析了当
小莹莹
2018/04/23
7380
报告显示 :2016互联网数据分析人才高度稀缺
数据百问系列:数据分析和数据挖掘的区别是什么? (附真实招聘数据对比报告)
数据分析和数据挖掘是数据从业者非常关注的两个岗位。这两个岗位到底有哪些区别?常听人说数据分析偏业务、偏前台,而数据挖掘偏技术,偏后台。所以要早点选定一个方向进行深耕才行?
木东居士
2020/08/11
2.2K0
大数据工程师2024版(37周)
大数据工程师是利用大数据技术处理大量数据的专业技术人员,他们负责数据的采集、清洗、分析、治理、挖掘,并对这些数据加以利用、管理、维护和服务。大数据工程师的工作内容包括但不限于数据处理、数据分析、架构设计、技术创新、团队协作和业务理解等多个方面。
小企鹅204415010
2024/06/19
3420
数据导入与预处理-第8章-实战演练-数据分析师岗位分析
本案例数据为招聘网站上收集的有关数据分析师岗位的数据,对该数据集从数据分析的角度出发,利用pandas、pyecharts库处理与展现数据,开发一个完整的数据分析项目。
用户2225445
2022/11/12
1.1K0
数据导入与预处理-第8章-实战演练-数据分析师岗位分析
【求职】做数据分析师也有三重境界
最近,“大数据”成了媒体解读两会的“利器”。活泼的数据图表一出现,枯燥的政府报告、政策解读都变得有趣和易懂了。   将大数据当作金矿的话,那数据分析师就是掘金人——作为这一新兴产业的弄潮人,他们在人才市场上也是独领风骚哦!普通数据专员月薪3000元以上,高级数据专员年薪可达40万元到50万元。   而最重要的是,通过数据参与企业管理和市场营销,数据分析师成长为企业高层也充满各种可能。   数据分析员究竟工作内容是什么?他们如何工作?进入这行要具备哪些职业素养?本期行当版为你一一解答。   高级数据分析师不好
小莹莹
2018/04/18
1.1K0
数据分析项目-数据分析岗位近况分析
对表中的position、salary_range、work_year、city、text、company_welfare字段数据进行清洗
Python研究者
2020/09/28
2K0
数据分析项目-数据分析岗位近况分析
推荐阅读
相关推荐
我的数据分析师转型之路,从零到字节跳动数据分析师
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验