bree是数据工程师,给我们组各个同学修了2年的电脑,是我觉得是我们组最聪明的小同学(我真不怕得罪人啊)。你觉得工程师不会画图?那就错了!他自学了一天PS,然后图就花成这样了....
TypeA 数据科学家:
偏Analysis,一切为数据驱动的决策服务。主要的工作是在清理数据,做分析,找Insight,做Report 等等。可以说是某类升级版的Analyst 或者BD。
一方面这意味着对你的你要求跟做BD 或 Analyst的要求一样甚至更高,对市场了解如何?对行业了解如何?对公司运作了解如何?而所谓 MachineLearning 等工具只是技术与手段,能够帮助更好地解决问题,但是问题有哪些,才是根本的问题。
另一方面传统Analyst 不足的地方在于随着数据越来越大,越来越复杂,如果要更快更准,需要使用更好的模型(机器学习等),在更原始的数据中探索与分析,不能只等待其他人把数据都处理好。因此需要更强的数据处理、分析能力和对于新模型、工具的掌握和理解。
往这个方向发展,要补齐Marketing、Business、Finance、Operation等知识,同时掌握各种机器学习的算法与工具。
TypeB 数据科学家:
偏Research & Product,在算法即产品的职责下让算法能够与产紧密结合,甚至主导算法驱动的产品。主要的工作是把算法从Research 做到Product。
一方面要对各类机器学习的算法了解足够深刻,了解各种机器学习算法的常见应用(NLP,CV,Recommendation,IR,etc.)。同时对工程要求更高,毕竟做Prototype 和上Production 是完全不一样的。
另一方面要对产品的需求有更深层次的理解,以及了解公司的业务逻辑,因为随着不少算法的成熟,产品的需求已经不仅仅来自于product-market-fit,而是来自于算法本身的进步,因此能够把成熟的算法推向产品是非常重要的能力。
往这个方向发展,Coding的要求与所有通用 SoftwareEngineering 的要求一样,该修 CS课可能一样都不能少,同时要能了解公司的业务逻辑,更好地推动产品的上线,让不可能变成可能。
领取专属 10元无门槛券
私享最新 技术干货