前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >在IT行业工作了10年之后,我转行成了一名数据科学家

在IT行业工作了10年之后,我转行成了一名数据科学家

作者头像
CDA数据分析师
发布于 2018-02-26 08:04:06
发布于 2018-02-26 08:04:06
1.1K0
举报
文章被收录于专栏:CDA数据分析师CDA数据分析师

原作者  Karthe

编译 CDA 编译团队

本文为  CDA 数据分析师原创作品,转载需授权

数据分析是新的职业潮流

我机缘巧合进入了数据科学行业,一开始这并不是我的梦想。在这之前,我是一个大型机程序员。很长一段时间,我唯一目标是参加一个不错的MBA课程。

直到 2013 年,我已经在软件服务行业工作了 9 年。我的工作稳定下来,看不到有太多发展空间。直到我了解到即将到来的新潮流——“数据分析”。

最开始进入分析行业时感觉困难重重。首先,当时公司内部没有太多的分析性策略。其次,随着数据分析逐渐发展成为大多数公司(尤其是信息技术服务)的商业智能部门的延伸,对于我这种没有数据分析背景的人,公司不太会愿意先对我进行培训,再完成他们的分析工作。此外,当时相关在线课程很少。

自我觉醒

接着我决定重新调整自己,适应数据分析行业。我申请了印度的几个长期数据分析课程项目。之前,我并不知道数据分析类课程会侧重数学(高等数学)和技术,直到第一天上课前,我都十分担忧。这是由于我一直使用的技术较为落后,而且不需要经常更新。

任何数据科学家都应该具备的主要技能,不仅仅是叙述的能力,还有对信息进行质疑和分析的能力。

结构化转型的优势

从大型机程序员转行进入数据科学行业,我经过了两个阶段——第一个阶段是在为期一年的项目中,另一个是我在日常工作中所面临的挑战。

一年的分析课程是极具挑战性的,是目前我人生中我最艰难的挑战(但也是最有价值的)。作为一个 5 岁小孩的父亲,一个上班族,应付这门课程非常困难的。每周的在线课程,考试,家庭作业,都在轮番轰炸我。

一年的课程对我所有的同学来说都是一段过山车的经历。我还记得为了完成测试任务度过的不眠之夜,清晨的课、深夜的讨论以及大家一起的努力——如果没有同伴的支持,我是无法完成这一切的。

初次面试

工作面试就像第一次约会,结果难以预测。

我面临的下一个挑战就是开始找寻数据科学领域的工作机会。招聘经理通常会关注那些在非数据科学领域也有丰富经验的人。幸运的是,通过课程中的 capstone 项目,我与一个知名的零售品牌有过合作。面试官对我在这个项目中解决问题的过程十分感兴趣。

如今,我看到很多人通过积极参与数据科学竞赛来增加面试中的优势。事实上据我所知,在面试中,在数据科学领域勇于竞争,这点要比实际工作经验更重要。

经验教训

在转行过程中,我在学术方面所面临的挑战主要来自数学;在工作方面,我面临着来自流程和领域方面的挑战。在这里,我将向大家分享以下当中的经验教训:

• 掌握领域知识

任何数据科学家所面临的挑战之一是领域知识不足。如果没有掌握领域知识,数据科学家将无法解决任何业务问题。没有正确的变量集,将无法建立完善的预测模型。没有商业知识,所得出的方案将是徒劳的。

• 与客户设定正确期望

客户可能不了解分析。他们所知道的是,如果给到数据,数据科学家们会进行分析,并得出改进业务的措施。

• 掌握 SQL 和数据库的知识

我之前认为,数据工程师的职责是提取构建用例所需的相关数据,这是错误的。公司可能不会特意雇佣一个人来提取数据。数据科学家应该知道如何提取所需的数据,并将数据转换为所需的格式。

• 分析数据的耐心

数据分析必须从各个角度考虑问题。我们永远不知道数据中存在什么样的模式。但是,通过遵循结构化的数据分析方法和一些耐心,是能够确定数据所遵循的模式。

• 提出解决方案

在我看来,这比建立模型更重要。数据科学家所做的所有努力工作都只能在这个领域进行展示。同时需要注意沟通的场景,我们可能不会与用户讨论 R 平方或 ROC 曲线问题。

• 坦然面对失败

最初几天我所做的大部分工作都失败了。每次我向客户提出解决方案时,都有很高的几率被拒绝。但最终我认识到,所有这些都是数据科学职业生涯的一部分。如果你是数据分析领域的新手,或者在没有导师的情况下开始学习,那就试着找个导师。

自我反思

以下是一些打算转行前应该问自己的问题:

• 为什么想转行?

有很多之所以想转行,只是因为他们对现有的工作,经理,公司等不满意。如果你也是这样的话,试着看看在目前的工作中是否能找到乐趣。转行可能无法解决你的问题。

• 转行前有丰富的工作经验。

如果你之前有超过 7 年的工作经验,请三思而后行。在这种情况下,在工作中你可能不被允许进行尝试,而被期望做出成绩。

• 为什么想进入数据科学行业?

如果答案是数据科学行业赚钱的话,请再想想! 你将会进入一个至少前几年都困难重重的领域。你需要紧跟行业发展最新动向,这不是件易事。

• 对分析工作有什么了解?

通过自我测试。通过一些在线课程来测试你是否适应数据科学。通常,如果你不喜欢数学,不喜欢数据库和如 SQL 类查询工具,你不应该把数据科学当作你的职业。

ref:

https://www.analyticsvidhya.com/blog/2016/09/mystory-i-became-a-data-scientist-after-working-for-10-years-in-it-industry/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2017-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CDA数据分析师 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
一行Pandas代码制作数据分析透视表,太牛了
相信大家都用在Excel当中使用过数据透视表(一种可以对数据动态排布并且分类汇总的表格格式),也体验过它的强大功能,在Pandas模块当中被称作是pivot_table,今天小编就和大家来详细聊聊该函数的主要用途。
用户6888863
2022/06/08
9690
一行Pandas代码制作数据分析透视表,太牛了
【原创干货】6000字、22个案例详解Pandas数据分析/预处理时的实用技巧,超简单
上两篇原创的文章,小编主要是讲了数据可视化方面的内容,但是好像看得人不是很多的样子(搞得小编心里拔凉拔凉的....)
用户6888863
2022/04/13
1.6K0
【原创干货】6000字、22个案例详解Pandas数据分析/预处理时的实用技巧,超简单
数据清洗之 透视图与交叉表
透视图与交叉表 在数据分析中,数据透视表是常见的工具之一,需要根据行或列对数据进行各个维度数据的汇总,在pandas中,提供了相关函数解决此类问题 交叉表更多用于频数的分析 pivot_table(data, index, columns, values, aggfunc, fill_value, margins, margins_name=) data:数据 index: 行分组键 columns:列分组键 values:分组的字段,只能为数值型变量 aggfunc:聚合函数 fill_value: 缺失
ruochen
2021/05/14
1.6K0
数据清洗之 透视图与交叉表
开启机器学习的第一课:用Pandas进行数据分析
翻译 | AI科技大本营 参与 | 林椿眄 本课程的目的并不是要开发一门全新的机器学习或数据分析的综合入门课程,也不是想借此来取代基础教育、在线/离线课程或一些专业和书籍。我们推出本系列文章是为了让初学者快速地回顾一些基础知识,并帮助你找到进一步学习的方向。 首先用简短通俗的语言回顾数学和机器学习的基础知识,并引用了一些其他资源,这种教学的方法与一些深度学习书籍类似。 此外,课程不单单注重理论的讲解,更强调完美地平衡理论与实践。因此,每个理论主题讲解后都有一个对应的练习专题,方便初学者通过自己动手来巩
AI科技大本营
2018/04/26
1.6K0
开启机器学习的第一课:用Pandas进行数据分析
数据分析之Pandas变形操作总结
pandas 是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。
Datawhale
2020/07/02
4.1K0
数据分析之Pandas变形操作总结
盘一盘 Python 特别篇 16 - Cross Table
交叉表 (cross table) 是透视表的特例,其默认的整合函数是计算个数或频率。
用户5753894
2020/06/24
1.2K0
【数据处理包Pandas】数据透视表
使用stack方法把列索引变成行索引(默认是把最低级列索引变成最低级行索引),此时行索引有3级。
Francek Chen
2025/01/22
3740
【数据处理包Pandas】数据透视表
Pandas 2.2 中文官方教程和指南(十四)
pandas 提供了用于操作Series和DataFrame的方法,以改变数据的表示形式,以便进行进一步的数据处理或数据汇总。
ApacheCN_飞龙
2024/04/25
5340
基于Titanic数据集的完整数据分析
本文是一个极度适合入门数据分析的案例,采用的是经典数据集:泰坦尼克数据集(train部分),主要内容包含:
皮大大
2023/05/05
1.4K0
【干货原创】厉害了,在Pandas中用SQL来查询数据,效率超高
今天我们继续来讲一下Pandas和SQL之间的联用,我们其实也可以在Pandas当中使用SQL语句来筛选数据,通过Pandasql模块来实现该想法,首先我们来安装一下该模块
用户6888863
2022/04/13
5570
【干货原创】厉害了,在Pandas中用SQL来查询数据,效率超高
数据透视之交叉表 crosstab()
不要被名字所迷惑,其实它也是二维的表结构,与pivot_table很相似,且是一个特殊的数据透视函数,它默认统计分组项的频次。
double
2019/05/28
2.8K0
《Pandas 1.x Cookbook · 第二版》第05章 探索性数据分析
概括性统计包括平均值、分位值、标准差。.describe方法能计算DataFrame中数值列的统计信息:
SeanCheney
2021/03/02
7120
《Pandas 1.x Cookbook · 第二版》第05章 探索性数据分析
左手用R右手Python系列10——统计描述与列联分析
数据统计描述与列联表分析是数据分析人员需要掌握的基础核心技能,R语言与Python作为优秀的数据分析工具,在数值型数据的描述,类别型变量的交叉分析方面,提供了诸多备选方法。 这里根据我们平时对于数据结构的分类习惯,按照数值型和类别型变量分别给大家盘点一下R与Python中那些简单使用的分析函数。 R语言: 描述性统计:(针对数值型) library("ggplot2") myvars<-names(diamonds)[c(5,6,7)];myvars [1] "depth" "table" "price"
数据小磨坊
2018/04/11
3.7K0
左手用R右手Python系列10——统计描述与列联分析
Pandas高级教程之:Dataframe的重排和旋转
使用Pandas的pivot方法可以将DF进行旋转变换,本文将会详细讲解pivot的秘密。
程序那些事
2021/06/15
1.5K0
Pandas进阶|数据透视表与逆透视
数据透视表将每一列数据作为输入,输出将数据不断细分成多个维度累计信息的二维数据表。在实际数据处理过程中,数据透视表使用频率相对较高,今天云朵君就和大家一起学习pandas数据透视表与逆透视的使用方法。
数据STUDIO
2021/09/26
4.7K0
Pandas进阶|数据透视表与逆透视
python数据分析——数据分类汇总与统计
数据分类汇总与统计是指将大量的数据按照不同的分类方式进行整理和归纳,然后对这些数据进行统计分析,以便于更好地了解数据的特点和规律。
鲜于言悠
2024/03/20
1.8K0
python数据分析——数据分类汇总与统计
python数据分析——数据分类汇总与统计
推荐一个网站给想要了解或者学习人工智能知识的读者,这个网站里内容讲解通俗易懂且风趣幽默,对我帮助很大。我想与大家分享这个宝藏网站,请点击下方链接查看。 https://www.captainbed.cn/f1
鲜于言悠
2025/03/08
1.2K1
python数据分析——数据分类汇总与统计
pandas系列7-透视表和交叉表
透视表pivot_table是各种电子表格和其他数据分析软件中一种常见的数据分析汇总工具。 根据一个或者多个键对数据进行聚合 根据行和列上的分组键将数据分配到各个矩形区域中 一文看懂pandas的透视表 Pivot_table 特点 灵活性高,可以随意定制你的分析计算要求 脉络清晰易于理解数据 操作性强,报表神器 参数 data: a DataFrame object,要应用透视表的数据框 values: a column or a list of columns to aggregate,要聚合的列
皮大大
2021/03/02
1.4K0
《利用Python进行数据分析·第2版》第10章 数据聚合与分组运算10.1 GroupBy机制10.2 数据聚合10.3 apply:一般性的“拆分-应用-合并”10.4 透视表和交叉表10.5 总
对数据集进行分组并对各组应用一个函数(无论是聚合还是转换),通常是数据分析工作中的重要环节。在将数据集加载、融合、准备好之后,通常就是计算分组统计或生成透视表。pandas提供了一个灵活高效的gruopby功能,它使你能以一种自然的方式对数据集进行切片、切块、摘要等操作。 关系型数据库和SQL(Structured Query Language,结构化查询语言)能够如此流行的原因之一就是其能够方便地对数据进行连接、过滤、转换和聚合。但是,像SQL这样的查询语言所能执行的分组运算的种类很有限。在本章中你将会看
SeanCheney
2018/04/24
5.1K0
《利用Python进行数据分析·第2版》第10章 数据聚合与分组运算10.1 GroupBy机制10.2 数据聚合10.3 apply:一般性的“拆分-应用-合并”10.4 透视表和交叉表10.5 总
pandas透视表分析
数据透视表是一个用来总结和展示数据的强大工具。pandas提供了pivot_table()函数以快捷地把DataFrame转换为透视表。
陆勤_数据人网
2019/05/28
2.3K0
推荐阅读
相关推荐
一行Pandas代码制作数据分析透视表,太牛了
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档