Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >如何避免数据科学领域的新手错误?

如何避免数据科学领域的新手错误?

作者头像
AI研习社
发布于 2019-08-09 12:38:50
发布于 2019-08-09 12:38:50
8730
举报
文章被收录于专栏:AI研习社AI研习社

原标题 | How to avoid rookie mistakes in the field of Data Science?

作 者 | Pritha Saha

翻 译 | CONFIDANT(福建师范大学)

编 辑 | Pita

我最近开始通过自学成为数据科学家的旅程,这条路并不总是一帆风顺的,因为没有人给我详细而有序的教学大纲。我尝试做了几件事,都没有很成功,但后来又有所收获。如果您是一位有抱负的数据科学家,本文可能会帮助您避免犯我曾经所犯的错误。

首先,永远不要试图通过死记硬背学习机器学习算法,大脑只保留了其中的一部分,掌握它们的最好方法是不断练习,没有捷径!

我犯了一个错误,在 Udemy上修“机器学习 A-Z:Python 和 R 在数据科学中的应用”这门课时我学会了课程的前半部分,但作为一个初学者,读完剩下的部分最终变得单调乏味。我确实对大多数算法有了直观的认识,但现在回头看,我觉得我本可以不学这门课。

其次,不要忽视编程,这是掌握数据科学的关键部分。你最好精通编程语言,特别是最受欢迎的Python,因为它拥有大量的库,这有助于数据科学家随时部署可用的工具。此外,大多数课程和比赛都要求我们用Python编写代码。因此,“python式”的思维模式对于数据科学的职业生涯是至关重要的!

我得到了两个资源的帮助——开始的Codecademy和后来的Datacamp。我很快就放弃了Codecademy,因为它从一个非常基本的层次开始——可能是为那些不是来自技术领域的人准备的。我订阅了一年的Datacamp,从数据科学的角度来看,这是一个很好的学习Python的资源。你最终要学习的图书馆课程有numpy、scipy等有关于数据分析和可视化的项目。同样,我们没有必要记住语法,熟悉该语言的函数和包是很重要的,而准确的语法你可以在google上搜索到。Stack Overflow是一个很好的资源,可以找到查询的答案,也可以回答其他人的问题。

此外,在不分析数据集的情况下,人们甚至不应该考虑机器学习算法。机器学习部分只有2-3行代码,其余部分用于详细的数据分析和可视化。如果不知道数据中的模式,就不可能确定哪些输入对输出很重要,从而消除数据中的噪声,最后转换数据,使其为模型使用做好准备。Kaggle是一个很好的资源,可以让您开始进行简单的机器学习练习(Titanic和房价预测),并着手进行数据清理和转换。

在后面的文章中,我将更多地介绍数据工程。在那之前,保持对成为数据科学家的憧憬,努力寻找解决遇到的任何问题!

via https://towardsdatascience.com/how-to-avoid-rookie-mistakes-in-the-field-of-data-science-3076017cdab1

封面图来源:https://www.adcreview.com/articles/big-data-in-science-which-business-model-is-suitable/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-08-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI研习社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
独家 | 数据科学入门指南:新手如何步入数据科学领域?
数据科学,据说是本世纪最吸引人的工作,已经成为我们许多人梦寐以求的工作。但对某些人来说,数据科学看起来像一个充满挑战的迷宫,让人无从下手。如果你也是其中之一,那就继续阅读。
数据派THU
2020/06/01
8520
独家 | 数据科学入门指南:新手如何步入数据科学领域?
2017年最全的数据科学学习计划(1)
导读 希望这篇学习路线图对你学习数据科学有帮助,需要说明的是国内本文中所说的数据科学家在国内一般称为数据分析师或者数据挖掘师,尽管称谓不同,但文章的路线图仍可作为学习指南供需要的同学参考。 如果你对英文不是很擅长,也可以到PPV课大数据学习社区获取相关的中文课程和学习指南。关于如何成为一名数据科学家,如果你有自己的学习路线图,希望你能乐意与我分享。 好了,现在就开启你的洪荒之力,和我们一起踏上数据科学的神奇之旅吧! 为什么要写这篇学习路线呢? 在AnalyticsVidhya上的众多资源中,学习路线图
小莹莹
2018/04/19
1.5K0
2017年最全的数据科学学习计划(1)
优质数据科学课程推荐:总结篇
原作者   David Venturi 编译 CDA 编译团队 本文为  CDA 数据分析师原创作品,转载需授权 一年以前,我还只是一个没有任何编程经验的技术宅。在试着上了一些在线课程之后,我深受启发,接着决定开始学习加拿大最好的计算机科学课程之一。 两周后,我意识到我可以通过 edX ,Coursera 和 Udacity 来学习我需要的一切知识,并且更快、更有效、成本更低。所以我退学了。 在不久之后,我开始通过使用在线课程创建自己专属的数据科学硕士学位。并且制定了一份数据科学编程方向的课程清单,其中很多
CDA数据分析师
2018/02/26
1.3K0
优质数据科学课程推荐:总结篇
手把手 | 数据科学速成课:给Python新手的实操指南
大数据文摘作品 编译:王梦泽、丁慧、笪洁琼、Aileen 数据科学团队在持续稳定的发展壮大,这也意味着经常会有新的数据科学家和实习生加入团队。我们聘用的每个数据科学家都具有不同的技能,但他们都具备较强的分析背景和在真正的业务案例中运用此背景的能力。例如,团队中大多数人都曾研究计量经济学,这为概率论及统计学提供了坚实的基础。 典型的数据科学家需要处理大量的数据,因此良好的编程技能是必不可少的。然而,我们的新数据科学家的背景往往是各不相同的。编程环境五花八门,因此新的数据科学家的编程语言背景涵盖了R, MatL
大数据文摘
2018/05/23
1.3K0
如何从零开始,自学成为一名数据科学家?
导读:如何通过免费方式学习数据科学?数据科学家 Rebecca Vickery 从技术能力、理论和实践经验三个方面入手介绍了自己的经验。
GitHubDaily
2019/10/29
1K0
如何从零开始,自学成为一名数据科学家?
想学习数据科学?我们整理了一份优质编程入门课程清单
原作者 David Venturi 编译 CDA 编译团队 本文为 CDA 数据分析师原创作品,转载需授权 一年以前,我还只是一个没有任何编程经验的电脑爱好者。在试着上了一些在线课程之后,我深受启发,接着决定开始学习加拿大最好的计算机科学课程之一。 两周后,我意识到我可以通过 edX ,Coursera 和 Udacity 来学习我需要的一切知识,并且更快、更有效、成本更低。所以我退学了。 在不久之后,我开始通过使用在线课程创建自己专属的数据科学硕士学位。并且制定了一份数据科学编程方向的课程清单,
CDA数据分析师
2018/02/26
1.5K0
想学习数据科学?我们整理了一份优质编程入门课程清单
严格的评选标准,造就了这张分享量过千的在线机器学习课程榜单
选自Medium 作者:David Venturi 机器之心编译 本文作者 David Venturi 是技术博客 freeCodeCamp 的知名主笔之一。 一年半前,我退出了加拿大最好的计算机科学专业。之后我通过线上学习资源开始了自己的数据科学硕士学位项目。我意识到能通过 edX、Coursera 和 Udacity 学到所需要的一切,而且能学得更快更高效,开销也更少。 现在我的学习就快完成了。我已经学习了很多数据科学相关课程,并部分旁听了很多其他课程。我知道现在有很多机会,也知道成为数据分析师或数据
机器之心
2018/05/08
1.2K0
严格的评选标准,造就了这张分享量过千的在线机器学习课程榜单
数据科学初学者九种常见错误
如果你想开始一个数据科学方面的职业,你可以通过避免这9个会使你付出高代价的初学者错误来免去几天,几个星期甚至几个月的挫折。 如果你不仔细,这些错误将会消耗你最宝贵的资源:你的时间、精力和动力。 我们将它们分为三类: 学习数据科学时的错误 求职时的错误 求职面试中的错误 学习数据科学时 第一组错误是“隐蔽的”,很难发现。没有丝毫的预兆,它们如同温水煮青蛙般耗尽你的时间和精力,并且它们产生的误解围绕这个领域。 1.花费太多时间在理论上 许多初学者陷入了花费太多时
陆勤_数据人网
2018/02/28
7380
数据科学初学者九种常见错误
入门 | 如果是个穷光蛋:如何从零开始学习成为一个数据科学家?
去年,我自学了数据科学,搜集了几百个在线资源,每天学 6~8 个小时。与此同时,我白天还在日托中心上班,拿着最低的薪资水平。
机器之心
2018/10/22
6300
入门 | 如果是个穷光蛋:如何从零开始学习成为一个数据科学家?
数据科学入门前需要知道的10件事
对于未知的学科,琳琅满目的学习资源,美好的工作机会,应该怎样去努力?本文作者是研究数据挖掘和生物医学方向,目前就职于泰国的一所研究大学的全职生物信息学副教授。他在22岁时开始自学数据科学,目前已经自学成才,文摘菌编译了这篇文章,希望能把以下需要注意的10件事告诉刚入门的你。
大数据文摘
2020/06/17
9320
数据科学入门前需要知道的10件事
[译]天龙八步:8步让你变成数据科学家
大数据文摘翻译作品 编译:焦剑,康欣 校对:孙沁(Kiki) 欢迎个人转发朋友圈;其他机构或自媒体转载,务必后台留言,申请授权 OK, 这些步骤不是那么简单。但是,它们都是可操作的,并且大多数步骤都是
大数据文摘
2018/05/22
7950
数据科学家的自我修养 | 哪些技能是必不可少的?
市场上对数据科学家的要求特别多:需要掌握机器学习、计算机科学、统计学、数学、数据可视化,深度学习等知识。要想全部掌握这些方面的知识,科学家需要学习数十种语言、框架和技术。那么,为此数据科学家应该如何合理地分配时间,该掌握哪些技能呢?
CDA数据分析师
2018/12/04
5410
数据科学家的自我修养 | 哪些技能是必不可少的?
避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)
本文是老司机给数据科学家新手的一些建议,希望每个致力于成为数据科学家的人少走弯路。
数据派THU
2018/09/17
5320
避坑指南:数据科学家新手常犯的13个错误(附工具、学习资源链接)
从 1 数到 13,想当数据科学家的你这些错误可别犯
当你看这篇文章的时候,我们知道你已经决定把数据科学当作你的工作。当下越来越多的企业需要数据支持其决策,世界也变得越来越紧密,几乎每个企业都需要大量的数据科学实践。因此,对数据科学家的需求是巨大的。当然,人才短缺也是业内所公认的。
AI研习社
2018/08/16
3930
从 1 数到 13,想当数据科学家的你这些错误可别犯
数据科学家 (Data Scientist) 的核心技能是什么?
这是国外数据科学学习平台DataCamp成员写的一篇图文《8步成为数据科学家》。我们具体来看下有哪些学习内容和学习资源。
猴子数据分析
2021/01/28
1.6K0
还在为自学数据科学发愁吗?化学工程毕业生教你如何转行
作为一名最近毕业于化学工程专业的学生,我第一份工作是在一家科技公司担任数据分析师。我曾在这里记录了从化学工程到数据科学的转变。从那时起,每当我与学校的学生谈论这一举动时,许多人表达了相同的兴趣和疑问……
大数据文摘
2020/11/24
7530
业界 | 数据科学家最需要什么技能?
数据科学家需要涉猎很多——机器学习、计算机科学、统计学、数学、数据可视化、通信和深度学习。这些领域中有几十种语言、框架和技术可供数据科学家学习。那么要想成为雇主需要的数据科学家,他们应该如何安排学习内容呢?
机器之心
2018/11/23
5530
R 语言 必备 十大资源
R 是进行统计计算和数据分析的热门编程语言之一,广泛应用于数据科学家、研究者和统计学家之间,用于处理大数据、执行复杂分析和结果可视化。
数据科学工厂
2024/12/30
3100
R 语言 必备 十大资源
[干货] 一个数据科学家的新年计划
关于转载授权 大数据文摘作品,欢迎个人转发朋友圈,自媒体、媒体、机构转载务必申请授权,后台留言“机构名称+文章标题+转载”,申请过授权的不必再次申请,只要按约定转载即可,但文末需放置大数据文摘二维码。 选文|孙强 翻译|赵娟 王珏 校对|姚佳玲 简介 新年并非仅仅是更换日历或是清晨起床后揉开双眼。新年是充满喜悦的一个崭新开始。它给我们一个完美的理由养成一个新习惯,它意味着新“希望”的到来。 如果你正在阅读这篇文章,我确信数据科学会让你兴奋!你要在2016年做出改变,难道不是吗?如果你从今天开始致力于实现这些
大数据文摘
2018/05/22
5720
我是如何从物理学转行到数据科学领域
很多人问我是如果从物理学转行到数据科学,本文讲述了关于我为什么决定成为一名数据科学家,以及我是如何追求并实现目标的。希望能够最终鼓励更多的人追求自己的梦想。让我们开始吧!
CDA数据分析师
2018/07/30
8080
我是如何从物理学转行到数据科学领域
推荐阅读
相关推荐
独家 | 数据科学入门指南:新手如何步入数据科学领域?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档