2年前,我还是一名7年没学数学的文科生,现在的我已经是一名在东京工作的数据科学家了。在机器学习热,数据分析热的大环境下,简单的谈谈作为一名文科生,我是如何转行的。
这波人工智能的浪潮早在几年前就开始了。那时候经常听到相关的新闻:AI会下棋,能认识人脸,能自动驾驶,但相比于对最新技术的憧憬,更害怕哪一天我被机器取代。我本身是一名在日本留学的文科生,毕业前小钻研了一下Java,运气比较好,碰上日本IT缺人,找到了一份儿系统工程师的工作,也算边学边干。工作一年,我发现我手头的工作基本是将一些业务逻辑自动化。而我更想用计算机做一些更酷的事情。所以决定转行数据科学这个行业。
很多人问,我是文科生能不能转行?我数学不好,能不能转行?
我想说的是,首先一定要纠正的思想是:“因为我专业不对口,所以我干不了那个”,或者“因为我不会,所以不能干”。我原来也有这种思想。没有谁生来就啥都会,写字说话都是我们一点一点学来的。如果把思想转换成:“因为我想干那个,可是我不会,所以我要学那个”,是不是更积极一点?
我自己的经历是,作为一个大学+研究生六七年没有学数学的文科生,不怕丢人的说,开始学习的时候,高中数学我只记得y=kx+b,看到Σ更不知道是啥东西。但不会的知识慢慢啃,到现在啃论文都不是什么问题了。
数据科学家在做什么?
我在一家专门做数据分析的公司。简单的说,我的工作是定义问题处理数据分析,建模撰写报告,跟教科书里的数据分析流程是一模一样的。
具体一点,就以前段时间接触的电话营销公司的项目举例:
我需要通过建模预测他们的潜在客户。谁会在哪一个时间段内接听电话?谁更容易推销成功?原本的电话营销就是拿着手里的名单,随便给人打电话,效率极低。而通过这个模型,接通率和成交率都成功提升了好几倍。
那之后也接到过这个电话营销公司的文本数据,即客户通话录音转化成的文本。原始的数据真的脏到一定程度,而我那时候还是个刚入职不久的小白,每天回家学习到很晚,在公司也各种跟大佬请教。最终写了一套还算复杂的算法,可以直接分析哪些语句利于成交,为电话营销员的话术提供优化方案。公司之后的确是打算提供自然语言解决方案,而我写的那套东西正是解决方案的第一步。对于刚入职的我来说,真正做出有商业价值的东西,给了我很大的成就感。
转行之后,有一个关键的软技能是成为数据科学家之前没有关注到的:沟通能力。
作为一名数据科学家,你必须了解如何将你的“数据故事”讲给不同背景的人:技术大佬、非技术背景的同事、关心其业务的雇主等(法律也规定涉及建模的时候,必须向客户解释这个模型的原理),沟通的重要性远比想象的重要。
文科生如何转行?
我的主要学习方法是网课+书。
【网课】:udacity的机器学习进阶纳米学位,Coursera机器学习
我曾经听有人说这两个课几乎成了找工作的标配。不管这句话是否严谨,但是我真觉得这两个是互补且必要的。Udacity偏实战,Coursera偏理论,真心推荐。
许多大佬鄙视调包侠,说许多人理论都没有消化透,只是会用调用Scikit-learn。但是代码和算法本身不是目的,目的是运算出的结果,以及是否能给客户带来利益、产生真正的商业价值。我认为用包算出来结果,比会手推公式本身重要得多。Udacity循序渐进地教授算法,同时通过项目巩固(类似kaggle?),最重要的是有reviewer给你纠错。不然你也不知道自己哪里对了哪里错了,盲目学习效率很低。
【书】
因为在国外,我就说一些国际通用的好了。
《Python for Data Analysis》
《Introduction to Machine Learning with Python》
这两本书是基本中的基本了,但是把这两本儿书看完,写一遍代码,就可以胜任一些最基本的数据分析的工作了。里面没有复杂的理论,但是足够调包了。
《Deep Learning from Scratch》
(中文名:深度学习入门:于python的理论与实践)
这个系列有两册,第一册是深度学习基本原理 还有CNN,第二册是自然语言处理相关+RNN系列(gru lstm等等)不调包,需要徒手装深度学习模型。(现在一方面做完感觉对深度学习恍然大悟,一方面发现读完后不会调包,无法用到实际工作中,又开始看《Deep Learning with Keras》之类的了)
我看市面上中文好像只有第一册,我贴个github好了T_T https://github.com/oreilly-japan/deep-learning-from-scratch
《机器学习》西瓜书大概看了一下 写的很好+很全,建议一看。
《深度学习》花书还没看,近期打算过一遍,没有发言权。
你以为学完课看完书就完了?Too simple
应该是所有data scientist 都在说的,要多读 多读 多读!我看的零碎文章,查的东西可能比书+课都多。可以搜一下data scientist roadmap,然后一点一点查漏补缺啦。
附带转行注意事项:
1. 没有工作经验、不是科班出生不用怕,只要有作品说话还是硬道理。当然只是嘴上说熟练使用ABC,面试官也不确定你说的熟练有多么熟练。你需要通过真正做过的项目,证明你懂这些知识方法。以及勤刷kaggle。
2. 面试:基本任何工作都离不开两个主要话题,会不会干和想不想干。前者是专业知识,后者包括转行/辞职的理由、工作的动力,提前准备好。
总体而言,相比之前的工作只是让业务效率化的,现在数据科学的工作能够利用数据为公司创造更多附加价值。同时,接触到了更多种多样的业务场景、用到更多新的技术、学到了更多知识,获得了更大的成就感。
-----------------------------------------------------------------------------------------
最后,第一份工作也是在Udacity学的Java,这次转行还是在Udacity学习的,蛮感激的。平心而论几乎是这里独特的reviewer的机制真的是很有帮助。(Udacity里面也有很多免费的课程,体验体验课程也很赞!!!)
领取专属 10元无门槛券
私享最新 技术干货