社区首页 >问答首页 >数据科学领域最重要的课程/科目是什么?

数据科学领域最重要的课程/科目是什么?
EN

Data Science用户
提问于 2015-08-28 16:46:37
回答 4查看 9.8K关注 0票数 6

我已经承担起了开始换工作的责任。我有良好的数学背景,但缺乏编程或数据科学的特定技能(如数据处理)。我一直在研究数据科学课程,并且已经被一门适当的数据科学课程所包含的大量学科所淹没了。仅举几个例子:自然语言处理、机器学习、R、Python、SQL、NoSQL、概率、统计、数值方法、算法和列表。

我负担不起回学校,但如果我的目标是进入数据科学,我应该集中注意力在哪些科目?

我完全理解“数据科学”是一个很大的领域,但肯定有几门学科对所有的人来说都是重要的,即使不是绝大多数,这些子领域也是如此。我想这基本上就是我的问题。我还没有获得足够的曝光量来确定我想要专攻的领域,所以在这一点上,我关心的是获得一个基金会,它不会限制我进入任何特定的子领域,或者换句话说,研究对所有子领域都有好处的学科。

注:与其他科目相比,数学对我来说不是那么重要。

EN

回答 4

Data Science用户

发布于 2015-08-29 19:20:29

也许最有用(也最有趣)的答案是由优秀的Swami Chandrasekaran提供的.以地铁地图的形式:

我只想补充一点:学校(或为了学习而学习)不能提供与解决一个真正的问题相同的经验。因此,要学习,找到真正的问题,你可以解决。为了保持动力,让他们成为你真正关心的问题。卡格尔比赛是一个很好的起点。即使是复制一个成功的解决方案(可能有一些变化,或者在一个新的数据集上),也将是一次巨大的学习体验。

票数 5
EN

Data Science用户

发布于 2015-08-29 18:27:31

“数据科学”不是一个很好的术语,人们用它来表达不同的意思。对某些人来说,这可能意味着在分布式系统上使用庞大的数据集;对某些人来说,这基本上是数据分析;对于某些人来说,这意味着使用稀疏矩阵编写预测模型(这就是我)。因此,你应该接近你感兴趣的东西。你不必什么都知道。

一般来说,数据科学是由计算机科学和统计两个领域组成的。对两者的基本理解至关重要。

票数 3
EN

Data Science用户

发布于 2015-09-09 16:41:26

我和你一样,把自己的职业道路变成了数据科学这一日益增长的领域。作为背景,我在一个神经科学研究实验室工作,研究等位基因变异对老年痴呆症和创伤后应激障碍的啮齿动物模型蛋白质转运的影响。我是一个有能力的R,bash和Matlab黑客,知道一点C和Java。当我开始申请神经科学PhD课程时,我改变了主意。

在接下来的一年里,我修了几门研究生水平的统计课程,并恢复了我的编程技能。去年,我开始了一个CS的MS项目,目的是在工业界找到一份数据科学家的工作,2)学习如何用算法/数学方法思考数据,3)真正提高我的基本CS技能--在这个过程中得到一些乐趣。

我不会列出有帮助的具体课程,但对我来说主要的获奖主题是:

  • 算法
    • 两种基本标志
      • 复杂性分析,排序和搜索,图算法,动态规划,随机算法等。提姆·鲁格花园有一个很好的过程。

代码语言:javascript
代码运行次数:0
复制
- data mining/massive dataset/stream algorithms  
    - locality sensitive hashing, sketch algorithms, kd/ball trees, reservoir sampling, sliding window methods, etc. 
  • 数据库/数据流:
    • noSQL、SQL、hadoop等。与它们一起工作迫使您开始意识到,您将处理的大多数数据完全不适合内存,并且需要独特的方法来从其中提取信息,而且只需要对其进行处理和检查。了解如何通过构建网络刮刀或数据收割机来填充数据库(或其他任何您想要的.)

  • 机器学习
    • 学习该领域的基本方法,如基于树的方法、优化、神经网络、svms、回归、马尔可夫链、图解方法、集成方法、过拟合、正则化、聚类、k-均值、knn等。吴家祥的课程可能是这一领域最好的开源解决方案。
    • 编辑:课程很好,如果你用真实版本(讲座备注)的东西来补充它的话。我认为Cour血清类对ML中的主题有一点简单和很好的概述,但对这些主题的机制还不够深入。汤姆·米切尔的也是一个很好的资源。

  • 数据可视化
    • 没有什么是完全必要的,但是知道如何可视化多维数据是非常有用的。学习一个很好的绘图包,也许还可以尝试其他技术,比如D3.js或映射可视化。如果你得到了真的很擅长这个,你可能永远都有一份很棒的工作。

  • “真实世界”体验
    • 我在一家大型网络公司做数据科学的三个月里学到的东西,比我在过去1.5~ 3年的研究生院和自学中学到的还要多。这可以通过进行Kaggle竞赛之类的方式来近似,但老实说,与Kaggle上的大多数数据相比,野外的数据要难得多(请注意,微软的恶意软件检测项目或一些计算机视觉项目对于学习处理同样“大”的杂乱数据更为有用)。

请注意,我没有提到“学习R--这是最好的”或“学习python --它比R更好”之类的东西。我使用Python、C、MySQL、MongoDB和R来完成我的大部分工作和当前的研究(尽管我现在非常喜欢python生态系统)。我相信这种情况将来会改变的。

这有点超出了你的问题,但作为一名行业数据科学家,最关键的事情可能是能够以一种几乎没有监督的方式工作,并向一组非专家清楚地传达结果/方法。有一个科学研究的背景有助于这一点,因为你试图回答的问题是困难的,通常是非结构化的,并且经常处于你的领域的知识的悬崖边缘。我的朋友、熟人和过去在工业界担任数据科学家的同事几乎都是有硕士或博士学位的前学术门路人士,而且至少有一些出版物在他们的腰包里。我绝对不相信这是一个严格的要求,如果我处于招聘职位,我绝不会选择仅仅因为某人没有高级学位就把他们排除在外,但行业招聘似乎倾向于要求获得硕士/博士学位或同等经验。

请记住,所有这一切都来自于一个来自无名氏的家伙,他没有在球场上呆那么久,但他的转变似乎很顺利。

票数 2
EN
页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://datascience.stackexchange.com/questions/6937

复制
相关文章
Symfony 服务容器入门
本文是依赖注入(Depeendency Injection)系列教程的第 3 篇文章,本系列教程主要讲解如何使用 PHP 实现一个轻量级服务容器,教程包括:
柳公子
2018/09/17
3.4K0
撸个 symfony4(一)
最近在看symfony,发现laravel里面也引用了这个框架,国内关于symfony的资料不是很多,但是体验了以下之后,感觉还是不错的,所以记录下踩坑之旅。这是[官方文档](https://symfony.com)
仇诺伊
2020/04/24
4490
撸个 symfony4(一)
Symfony 服务容器性能优化
本文是依赖注入(Depeendency Injection)系列教程的最后一篇文章,本系列教程主要讲解如何使用 PHP 实现一个轻量级服务容器,教程包括:
柳公子
2018/09/17
3.1K0
Symfony 服务容器性能优化
撸个 symfony4(二)
目标其实是完成如下的需求,如果有想看源码的,可以看下sf官网出的一个demo。
仇诺伊
2020/04/24
2.4K0
撸个 symfony4(二)
Symfony 服务容器:使用建造者创建服务
本文是依赖注入(Depeendency Injection)系列教程的第 5 篇文章,本系列教程主要讲解如何使用 PHP 实现一个轻量级服务容器,教程包括:
柳公子
2018/09/17
2.6K0
SSTI模板注入
模板引擎会提供一套生成HTML代码的程序,然后只需要获取用户的数据,然后放到渲染函数里,然后生成模板+用户数据的前端HTML页面,然后反馈给浏览器,呈现在用户面前。
Andromeda
2022/10/27
1.2K0
SSTI模板注入
代码审计 | 模板注入
这里主要学习下 FreeMarker 模板注入,FreeMarker 是一款模板引擎,FreeMarker 模板文件与 HTML 一样都是静态页面,当用户访问页面时,FreeMarker 引擎会进行解析并动态替换模板中的内容进行渲染,然后将渲染后的结果返回到浏览器中。
TeamsSix
2022/09/20
1.3K0
代码审计 | 模板注入
Symfony 服务容器:使用 XML 或 YAML 文件描述服务
本文是依赖注入(Depeendency Injection)系列教程的第 5 篇文章,本系列教程主要讲解如何使用 PHP 实现一个轻量级服务容器,教程包括:
柳公子
2018/09/17
1.8K0
nginx配置Symfony
server { listen 80; server_name blog.phpfs.com; root /data/web; rewrite ^/a
苦咖啡
2018/04/28
1.7K0
Symfony是什么
众所周知前面有说到PHP的七大框架,接下来就来说说Symfony框架,希望说的对大家有所帮助。
叫我可儿呀
2019/11/26
2.1K0
Symfony是什么
ssti模板注入 命令执行_access注入绕过
前言:​SSTI(服务端模板注入),已然不再是一个新话题,近年来的CTF中还是也经常能遇到的,比如护网杯的easy_tonado、TWCTF的Shrine,19年的SCTF也出了Ruby ERB SSTI的考点;本篇对这部分总结一下,方便未来做题和复习的时候查阅!也欢迎各路大佬在评论区指正或者放出自己的WP链接互相学习!
全栈程序员站长
2022/09/27
1.1K0
ssti模板注入 命令执行_access注入绕过
浅谈Flask模板注入攻击
​ 由于最近一直在学二进制,所以web方面时间就不是很充足了,在buuoj上做了几道web,其中有一道flask(jinja2)的SSTI,之前也接触过,所以今天就来复现下flask ssti,这里推荐一个学习环境
ly0n
2020/11/04
1.7K0
浅谈Flask模板注入攻击
详解模板注入漏洞(下)
在上一篇文章中,我们为读者详细介绍了模版注入漏洞的概念,模版引擎的识别方法,以及两种模版引擎相关的注入漏洞。在本文中,我们将继续为读者介绍其他四种模版引擎相关的注入漏洞。(上一篇传送门:详解模板注入漏洞(上))
程序猿DD
2021/01/12
1.8K0
详解模板注入漏洞(下)
模板注入漏洞全汇总
在MVC的设计模式下,一般从 Model 层中读取数据,然后将数据传到 View 层渲染(渲染成 HTML 文件),而 View 层一般都会用到模板引擎。
Jayway
2019/09/29
8.4K0
模板注入漏洞全汇总
详解模板注入漏洞(上)
作者 | 原作者gosecure,翻译整理shan66 来源 | http://gosecure.github.io/ 1.简介 所谓模板注入,又称服务器端模板注入(SSTI),是2015年出现的一类安全漏洞。James Kettle在2015年黑帽大会上进行的演讲,为多个模板引擎的漏洞利用技术奠定了坚实的基础。要想利用这类安全漏洞,需要对相关的模板库或相关的语言有一定程度的了解。 首先,本文将对模板注入漏洞进行相应的介绍,帮读者深入了解各种攻击模式,以更好地识别潜在的漏洞。然后,我们将考察5种不同的模
程序猿DD
2023/04/17
1.5K0
详解模板注入漏洞(上)
ThinkCMF 前台模板注入 RCE
ThinkCMF 是一款基于 PHP+MYSQL 开发的中文内容管理框架,底层采用 ThinkPHP3.2.3 构建。
wywwzjj
2023/05/09
1.5K0
ThinkCMF 前台模板注入 RCE
SSTI模板注入到 RCE
正如你在下图中看到的,有可能在页面上放置一段 HTML 代码,看着它,我立即想起了 XSS 漏洞。
信安百科
2023/09/06
2640
SSTI模板注入到 RCE
SSTI模板注入 | No_Bypass
模板可以理解为是一段固定好格式,并等着你来填充信息的文件,模板注入就是指将一串指令代替变量传入模板中让它执行
h0cksr
2023/05/17
5300
SSTI模板注入Plus | Bypass
除了标准的python语法使用点(.)外,还可以使用中括号([])来访问变量的属性
h0cksr
2023/05/17
4380
SSTI模板注入Plus | Bypass
(精编)Python与安全(三)SSTI服务器模板注入
__mro__返回一个包含类或对象所继承的基类元组。方法在解析式按照元组的顺序解析,从自身所属类到<class'object'>。
Power7089
2020/07/27
8570
(精编)Python与安全(三)SSTI服务器模板注入

相似问题

无法在Symfony 4服务上注入模板

34

如何将Doctrine Entity Manager注入Symfony 4服务

42

Symfony 4服务注入的参数太少

10

Symfony 4依赖注入

10

将服务注入CLI Symfony 4应用程序

10
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档