我已经承担起了开始换工作的责任。我有良好的数学背景,但缺乏编程或数据科学的特定技能(如数据处理)。我一直在研究数据科学课程,并且已经被一门适当的数据科学课程所包含的大量学科所淹没了。仅举几个例子:自然语言处理、机器学习、R、Python、SQL、NoSQL、概率、统计、数值方法、算法和列表。
我负担不起回学校,但如果我的目标是进入数据科学,我应该集中注意力在哪些科目?
我完全理解“数据科学”是一个很大的领域,但肯定有几门学科对所有的人来说都是重要的,即使不是绝大多数,这些子领域也是如此。我想这基本上就是我的问题。我还没有获得足够的曝光量来确定我想要专攻的领域,所以在这一点上,我关心的是获得一个基金会,它不会限制我进入任何特定的子领域,或者换句话说,研究对所有子领域都有好处的学科。
注:与其他科目相比,数学对我来说不是那么重要。
发布于 2015-08-30 03:20:29
也许最有用(也最有趣)的答案是由优秀的Swami Chandrasekaran提供的.以地铁地图的形式:
我只想补充一点:学校(或为了学习而学习)不能提供与解决一个真正的问题相同的经验。因此,要学习,找到真正的问题,你可以解决。为了保持动力,让他们成为你真正关心的问题。卡格尔比赛是一个很好的起点。即使是复制一个成功的解决方案(可能有一些变化,或者在一个新的数据集上),也将是一次巨大的学习体验。
发布于 2015-08-30 02:27:31
“数据科学”不是一个很好的术语,人们用它来表达不同的意思。对某些人来说,这可能意味着在分布式系统上使用庞大的数据集;对某些人来说,这基本上是数据分析;对于某些人来说,这意味着使用稀疏矩阵编写预测模型(这就是我)。因此,你应该接近你感兴趣的东西。你不必什么都知道。
一般来说,数据科学是由计算机科学和统计两个领域组成的。对两者的基本理解至关重要。
发布于 2015-09-10 00:41:26
我和你一样,把自己的职业道路变成了数据科学这一日益增长的领域。作为背景,我在一个神经科学研究实验室工作,研究等位基因变异对老年痴呆症和创伤后应激障碍的啮齿动物模型蛋白质转运的影响。我是一个有能力的R,bash和Matlab黑客,知道一点C和Java。当我开始申请神经科学PhD课程时,我改变了主意。
在接下来的一年里,我修了几门研究生水平的统计课程,并恢复了我的编程技能。去年,我开始了一个CS的MS项目,目的是在工业界找到一份数据科学家的工作,2)学习如何用算法/数学方法思考数据,3)真正提高我的基本CS技能--在这个过程中得到一些乐趣。
我不会列出有帮助的具体课程,但对我来说主要的获奖主题是:
- data mining/massive dataset/stream algorithms
- locality sensitive hashing, sketch algorithms, kd/ball trees, reservoir sampling, sliding window methods, etc.
请注意,我没有提到“学习R--这是最好的”或“学习python --它比R更好”之类的东西。我使用Python、C、MySQL、MongoDB和R来完成我的大部分工作和当前的研究(尽管我现在非常喜欢python生态系统)。我相信这种情况将来会改变的。
这有点超出了你的问题,但作为一名行业数据科学家,最关键的事情可能是能够以一种几乎没有监督的方式工作,并向一组非专家清楚地传达结果/方法。有一个科学研究的背景有助于这一点,因为你试图回答的问题是困难的,通常是非结构化的,并且经常处于你的领域的知识的悬崖边缘。我的朋友、熟人和过去在工业界担任数据科学家的同事几乎都是有硕士或博士学位的前学术门路人士,而且至少有一些出版物在他们的腰包里。我绝对不相信这是一个严格的要求,如果我处于招聘职位,我绝不会选择仅仅因为某人没有高级学位就把他们排除在外,但行业招聘似乎倾向于要求获得硕士/博士学位或同等经验。
请记住,所有这一切都来自于一个来自无名氏的家伙,他没有在球场上呆那么久,但他的转变似乎很顺利。
https://datascience.stackexchange.com/questions/6937
复制相似问题