前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一位美国TOP10统计专业本科生的经验:别走我这样的弯路

一位美国TOP10统计专业本科生的经验:别走我这样的弯路

作者头像
小莹莹
发布于 2018-04-19 06:34:22
发布于 2018-04-19 06:34:22
3.5K0
举报

平日里,有四成以上的疑难提问来自于计量与统计,相信统计的学习和进阶也是所有经管专业的BABY们绕不过去的一道坎儿,若能以较高的水平精通一门以上的统计工具,对学习和科研而言,则相当于掌握了一门利器,剑在手,可攻城拔寨,运用与心。今天的作者毕业于一所美国统计学专业排名前10的公立大学,从最初的陌生到与统计学相知、共舞,再到沉浸其中、倾心投入,及至打通统计学习的任督二脉,爱上统计学一文中不仅系统盘点了统计学习的经验和感悟,更对统计的学习资源做了悉心的标注和罗列,也能从中看到美国统计教育的教学模式,美中不足的是,作者是本科毕业,在总结的力度、厚度和学术沉淀的火候上要略欠一些,但对于统计学入门的新手以及跨学统计专业的朋友们来说,依然有一定的参考和借鉴价值,NOW,就让我们跟随作者的笔触,踏上一段统计的梳理和学习之旅...... 毕业于美国一个统计学专业排名前10名的公立大学。今年6月刚刚毕业。从大二上第一门统计专业课算起,已经和统计学打了三年的交道了。我从最开始by chance进的专业,到觉得这个专业无聊,再到开始对这个专业不讨厌,最后到现在觉得这个专业很性感,决定和统计学继续把交道打下去,其实中间还蛮曲折的。属于非常努力的那种学生,但是因为天赋有限,所以“努力”让自己在整个专业中的成绩稳定在中上游,“缺乏天赋”使自己没有能成为最优秀的。但是就是因为这样,才觉得自己在学习统计学方面的经验和体会对于大部分组员们还是很一定参考价值的。 相信大多数刚进来统计学专业的弟弟妹妹们,对统计学的理解就是限定于“概率”。比如一个袋子里面3个球,两个红的,一个白的,蒙住你的眼睛,问模到白色的球的概率是什么。我当时觉得这就是统计学,统计学就是这个。所以就导致了在学基础的数理统计的时候,对基础理论的掉以轻心,以导致之后花了1000%的力气去弥补当年的损失。为了避免学弟学妹们和我一样犯同样的错误,我一定会在这个帖子中好好承认我当年的问题,总结我当年血一样的教训,希望大家在读了这帖子后,有点启发,少走点弯路,多点时间去锻炼身体,以便更好地享受你和统计学有价值的时光。 1. 关于专业的选择:你一定要给你自己一个机会 相信有很多看到这篇帖子的同学还没有学习过这门专业,或者说是打算尝试下这门专业。从我的角度来看,我觉得大家不管上第一门统计课的动机如何,都应该给这个专业一个走进你的机会。不单单是对于统计这一个专业而言,其实是对于所有专业都是这样。我为什么这么讲呢?我高中是文科生。数学一般。物理奇烂。高一期末分科考试,因为物理不计入总体成绩,我又打算学文,于是就破罐子破摔,物理以17/120的成绩结束了我人生中最后一门物理课。真的是人生中最后一门物理课哦,这种恐“物”心理一直延续到我大学毕业,都没敢再上一门物理课。 我来美国读本科以后,其实也非常排斥数学,也因为我是文科生,从高二分科后,就觉得自己数学不好。其实这种心理暗示很恐怖的,自己总是觉得数学不好不好,就越发真的不好。于是本科打算进的专业也不能和数学有太大关系,于是就说学经济吧。后来发现,自己对专业的选择是多么幼稚可笑。学经济的人的数学能力应该是非常非常强的。我记得我的一个助教,她过去是北航学习物理的,现在是我本科学校的phd。她说经济学中的数学推导是最令人发指的,发指到她算着算着就不知道自己到底为什么这么算了。所以说大家在进去专业前,一定了解这个专业的性质是什么。我当时选择经济,就是因为国人都学,觉得这个是个很高级的专业。没有想到的是,经济学就要读PHD才有出路,且就业压力极大,除了faculty这条路基本上没有什么路了。 然后,大一上着上着的时候,知道了原来学校还有一个专业叫Applied Computational Mathematical Science,简称ACMS,是应用数学专业的一个本科分支。这个专业有个分支是数学经济。我觉得要不再选择个这个专业吧。虽然有点数学课,但是硬着头皮也能读下来,何况美国人民数学不好。于是我就又加了一个专业,就是这个ACMS。这个时候,我有了两个专业。所以大家在学一个专业或者课程前,千万不要根据自己过去的经历给自己下定义,为什么呢?因为我发现我自从选择了这个专业,要逼迫自己开始学数学的时候,我渐渐发现学数学真的很有意思。数学前几门入门课,都是几百人上的,里面鱼龙混杂,拿个高分不难。这种“假高分”就让我觉得学得挺有成绩感的。成就感真的会成就你对一个事物的兴趣的。后来上了高级别的课程,每个班级只有30个人的时候,那个时候的30个人都是真正的数学专业的,GPA比较难拿。但是因为尝试过,也比较喜欢,所以那个时候学习数学就是兴趣为先,GPA次要。现在有的时候,真的再想,当年应该学门物理课的,没准我现在就是物理专业了。 后来我是怎么又学了统计学呢?我大一结束的时候,去找ACMS的顾问,也就是advisor,讨论选课的事情。她看我上课上得蛮快的,说现在有一门叫做数理统计学的课程,是开学后秋天开始上,挺好的,问我想不想上。我当时想,什么是统计。我其实那个时候连statistics这个单词都要反应半天。就和advisor讲我还是不上了,因为不知道是什么。这个advisor超级热心,说这课报的人比能接纳的人多,而且一年一次,趁还有空余位置,就把我加进去,等我上了第一节课,再决定放不放弃。然后我一听,也好啊,反正没损失。之后就在2010年的秋天上了人生中第一门真正意义上的统计课。当时之所以没有在第一天扔掉这门课,就是发现想上这课的人真的好多好多,但是大部分都不能如愿,还要等一年才能上,自己有种赚到的感觉。 所以,学弟学妹们,一定要给你自己一个和陌生学科接触的机会。千万不要因为自己是文科生就觉得自己玩不了数字,也不要因为自己是理科生玩不了文学。一定要尝试,选专业如此,今后的路更是如此。可能你给自己的这个机会能改变你的人生轨迹。我就想如果我当年没有遇到这个热心的advisor,没有决定在那节课上待下去,我现在可能正在发愁到底学不学经济学,或者转不转专业的问题。 2. 关于选择几个专业:一定要精致,精致,再精致 我觉得我大学四年中,很遗憾的一件事情就是选择了三个专业。三个专业的好处是接触的知识多,范围广,找工作时候的对口工作多。但是对于大部分智商平常但又非常努力的童鞋们来说,弊绝对是大于利的。为什么呢? 人的精力是有限的,做得多就意味着做不精。三个专业,又想拿好的GPA,就意味着每天的日子不是为了学知识活的,而是为了GPA而战的。这种学习方式,就是学不精致:只要学到考试点上,绝不深究。不是因为不想深究,而是因为另外一门专业还要时间去保住GPA。如果让我重新选择,我会在我大二的时候放弃掉经济专业。把ACMS的专业方向从数学经济改成Operation Research,匀出些时间学统计专业里面的选修课程。还要匀出时间和教授做相关的research。这样自己统计方面的知识储备就更加完善。因为,对于一个真正想在统计学这条路上走下去的人来讲,本科阶段放弃了这种探究同领域不同方向的机会真的是很大的遗憾。尤其是对于统计学这种研究性专业来讲,在未来申请硕士和博士的时候,还是非常看重你本科的专业背景的。 所以,如果你们找到了自己真正喜欢的专业,改舍弃的东西,一定要毫不犹豫地舍弃。千万不要图多,要精致,一定要精致。何况,现在想想,其实把一个专业学精致了,找到的工作只会好不会差。 3. 零基础,入门统计学 在这部分中,我想根据自己大学中学习统计学的经验,介绍下如何在零基础的前提下完成统计学的入门。所以这部分的内容无论是对于本科阶段没有接触过统计的同学,还是小组中想了解这方面内容的前辈们都很适用。当然,如果你已经完成了本科阶段统计的学业,你可能是统计专业或者相关领域的研究生,PHD或者已经工作数年的职场达人,欢迎你来补充和critique我写的内容。 下面我根据我的学习内容,把统计学入门应该学的基础课程分成数学部分,编程部分和统计部分三个部分加以罗列。每个建议的topic下我都列出了建议使用的书籍(小编注:论坛原帖中包含对应的Amazon上的链接地址),有一些我还列出了一些网上课程的资料,希望能够减少大家花在google上的时间。虽然我学统计的时候,是不得不用英文学习,我还是建议大家直接学习英文课本。按照我周围人大部分人的经验来看,英文描述学术方面的语言更加简练易懂。总之,下面的书也都有中文译本,大家根据自己的实际情况选择最适合自己的方法就好。 A: 数学部分:以下内容按照顺序学习就好 解析几何和微积分 Stewart的Calculus 数学逻辑 Daniel J. Velleman的HowTo Prove It: A Structured Approach 基础微分 Boyce-DiPrima的Elementary Differential Equations and Boundary ValueProblems 矩阵代数及其应用 David Poole 的Linear Algebra: A Modern Introduction 实分析 Taylor的Advanced Calculus 线性代数 JohnH. Mathews 的Numerical Methods Using Matlab MIT的Linear Algebra公开课 B:计算机编程部分:没有必然的先后顺序之分 JAVA 关于使用哪个平台,我不是expert,大家问问周围的专业人士们,然后告诉我,我来更新。我使用的是—— jGRASP,这个应该是最常用的了。因为自己当初学JAVA就是应付差事(大家千万别学我)。 其实很多学习CSE的同学喜欢eclipse,更方便。 教科书是使用的Reges和Marty的Building Java Programs: A Back to Basics Approach 这本书也是U of Washington的两门基础JAVA编程课,CSE 142和CSE143,的教科书(非必买)。先上完142成绩合格了才能上143。这个两个课程的网站对外是公开的。真的是非常好的课程。我也看过很多JAVA的课程和公开课,这两门课程无论是从质量和难度上,绝对是JAVA课程中的上品。你如果认认真真完成了每个作业,即使是对于计算机专业的同学,也是非常大的提高。这两节课最初就是由教科书的两位作者上 的,虽然说Marty现在抛弃了UW去了Stanford,我还是怀念他四年前给我上这门课的场景。Reges也非常非常非常棒,我的第二门课是跟他的。他是那种能把编程这么无聊的事情讲成非常浪漫的事情的教授。他现在还是在UW为了这个课程的发展而拼搏。 CSE142 CSE 143 R语言 我最早用的就是CRAN的发布的R语言环境,现在用的是RStudio,好用太多,强烈推荐大家去下这个。 讲R语言的书很多很多,每本书都有它存在的闪亮点。我觉得有机会应该具体讨论下R语言的学习。根据我 的感受,看书绝对不是学习编程的最佳方式,但是绝对是最笨的方法。编程是作为工具存在的。非CS的同学,在学习编程方面要功利些,也就是有针对性地学习:有用的学,没用的就没有必要钻研(当然,如果日后打定主意走上统计这条不归路的时候,还是要深入学习,比如我)。这里有几本我觉得蛮有用的书籍。大 家千万不要掏腰包买,下载就好(我不能这么误导,但是真心觉得这种工具书,不值得买啊) R for Dummies R in a Nutshell Michael J. Crawley 的The R Book (这本书的中文版年末或者明年年初上架,问我为什么知道?因为我和另外几名战友在翻译这本书) Matlab Matlab据说在淘宝上可以买。在米国的话还要买正版,还好是学生价,99刀,虽然也不便宜,但是和非学生 价相比,我实在是谢天谢地。话说在国外的同学们,还是能用正版尽量用正版。我有认识人被抓住罚了2500大洋就是因为用学校网络下载盗版windows。虽然非常少发生,但是一旦发生了的话,2500大洋在美国能买25套windows正版系统了。 Matlab实在没有什么好的书推荐,因为我只是在学习线性代数的时候使用Matlab。平时都是使用R。但是有一个手册比较好。我当时学习matlab的时候就是靠它还有google写的作业。加上上面线性代数里面推荐的那本Matlab的书籍,应该够用了。 LaTex 写作业必备神器。大家不用专门买书的,其实google和LaTex网上的一些手册就够了。如果真的想系统学,Helmut和Patrick合著的Guide to LATEX还是不错的。 还有介绍个LaTex模板的网站,我感觉这个更常用些,我们的作业都是靠这个模板弄的。 C: 统计学学习部分 这部分开始真正意义上介绍和统计核心课程相关的学习内容。和与数学部分不同,这部分中的学习完全可以和我在计算机编程部分中讲的知识相互贯穿来学的。尤其是R语言的学习,对统计的了解和学习是及其有帮助的。 这个是重中之重。其实数理统计本身并不是多难,稍微有一些数学微积分基础的同学,掌握这部分内容应该非常快,但是想掌握扎实并且灵活了,非常难。好比说统计学中最基础的一个概念:平均数。不学统计的同学们也知道,平均数就是把所有的数据相加除以数目。但是学了数理统计的童鞋们,如果你们对平均数的概念就只是这样,那你们真的应该好好翻翻书再复习下了。 初中老师讲平均数的时候,还讲了中数,除了这些还讲了条形图,扇形图等各种各样的图。为什么要讲这些?为什么要讲平均数?其实在这个阶段,就是为了教你如何直观地观察数据,让你对数据有个直观的把握。后来我们学了variance,就发现,原来描述数据的时候,mean不准确,我们要结合variance才能更准确地明白数据。之后又有结合参数来讲mean。简单的算术mean和为了衡量参数而衍生出来mean有着不同的意义。这个mean可以用maximum likelihood estimator求得,也可以用method of moments求出。不同的distribution有mean, random resampling中有mean,做regression analysis的时候要用mean,连做statistical inference的时候还是要用到mean。Mean真是无处不在。虽然说这些定义还算是基础,但是非常容易搞混,一旦搞混了,你接下来的很多东西都不能学了。每天积攒点糊涂了,几个月下来就真的糊涂了。 这里推荐大家一本书—— Larsen 的Introductionto Mathematical Statistics and Its Applications (5th Edition), 他还配套一本参考答案,不过这本答案只有课后题的奇数题目的答案,偶数题目的答案只有教师用书上有。如果不会的话,只能google。 这本书算是我见过的所有的数理统计学书中最最简单直白的了: Student Solutions Manualfor Introduction to Mathematical Statistics and Its Applications 他前面一二章讲的是非常基础的概率知识,然后徐循渐进到较难的部分。整本书将近千页,但是对大家的数学水平并没有很高的要求,只要微积分基础还算是扎实,稍微知道点实分析中的分散和收敛就可以了。不过,这本书信息量也非常大,覆盖的内容也很广。我学数理统计学的时候,就是用的这本,连续三个学季,也就是9个月才把这本书从第一页学到了最后一页。到了后来学习更难的课程的时候,还要经常翻书来温故而知新,也可见本书对日后的学习有多重要了。这里我给大家分享下我学习这本书的心得,希望对自学的童鞋们有些帮助: ① 这本书最重要的是所有黑字的定义和公式。一定要把它们理解清楚了。包括大写的X和小写的x的具体定义,这些都要区分清楚。什么是value和random variable,什么是estimator和estimates。统计中这种看着一样的概念很多,要区分; ② 每道例题都要仔细弄懂,因为那些题目都非常有典型性。各种的经验和教训不断教育了LZ这些例题对日后学习有着非同寻常的意义; ③ 如果有时间,大家可以试着做下课后练习,可以帮助你更好地理解概念。我觉得这些联系不但要做,而且在没有到最后关头,不能看答案,最好能和人一起讨论下,这点应该对在校统计专业的弟弟妹妹们的一 个基本要求; ④ 如果很忙,非要给这本书分个层次的话,前12章是必学,最后两章可以选学: a. 一章到四章是最基础的部分: i. 其中一章到三章是基础中的基础; ii. 第四章开始讲分布。对于分布,大家应该了解的内容,可以见我们组里面发起的那个活动上面的内容,对于统计专业的童鞋,这些内容都是要大家融化在血液中的; b. 第五章是在第四章的基础上建立展开的,讲estimation。通过这章,大家对分布中的estimator的性质会有一个更立体的了解; c. 第六到第九章是讲statisticalinference,这个是日后大家学统计学用到的最多的东西; d. 第十章到第十二章是讲基础的regressionanalysis和AVOVA。如果大家以后有机会做dataanalyst方面的工作,做data prediction少不了regression,但是那个时候混合着其他概念,会更加复杂; e. 最后两章是experimentaldesign和non parametric statistics,这些都更加接近现实生活一点,就是在不知道现有数据分布和参数的情况下,如何做统计分析。当然讲得也非常浅显。 所以整体来讲Larson的这本书比较基础,但是每章之间的衔接非常紧密,这点应该和我一会儿推荐的书有所不同。那本书可能前面某章不懂,后面的章节还能明白,这本书一旦有一点知识弄不清楚了,后面的跟着也就不清楚了。 下面就推荐下这本,建议有一定理论基础的和统计专业的同学看看,是Edward 的Modern MathematicalStatistics 这本书没有Larson的讲得广,比如regression的部分根本没有提。但是这本书中每个topic的讨论都深入很多。比如method of moments,Larson的书里面只花了2页提了一下概念和对应的简单的而应用,但是这本书用了12页的内容讨论。这本书可以作为Larson的补充来学习。 基础数理统计最后要学到什么程度就说明你学得算是扎实可以进行下一部分的学习了呢?就是给你一篇统计学的paper,你可以根据paper中的逻辑,把他的演绎过程再自己演绎一遍,并且在不翻书的情况下,能说出每步的逻辑原理并加以描述论证。 4.回归分析regressionanalysis 及其应用 在数理统计的脉络疏通的前提下,可以开始学习回归分析。根据自己和周围人的感觉来看,从这部分开始就比较地抽象。不像是数理统计,即便不明白,仔细钻研几天还能弄明白。回归分析最大的难点是,本身就是非常抽象,因为涉及到矩阵分布的内容,加上对数理统计的功底深,要是任何一点不扎实,这部分肯定越学越崩溃(真的是要用崩溃二字形容)。 此外还建议大家好好学习线性代数的内容。我上文也有讲,还有推荐的公开课。 首先大家要弄清楚最基本的scatterplot,很多人觉得这个太简单了,没人重视,实际上scatterplot可以帮助你对regression有个大体的感觉。你通过学习这部分,知道了什么是outlier,知道了不同的correlation coefficient大体对应的图的形式,知道了给你很多数据,你是怎么把那条回归线画出来的。通过学习这种是geometricsense的概念,才容易理解simple linear 和multiplelinear regression这种data sense的抽象事物。 还是先推荐几本书: Douglas C. Montgomery 的Design and Analysis of Experiments,和Sanford 的 AppliedLinear Regression (Wiley Series in Probability and Statistics)。 前两本都是很传统的讲线性回归的书籍,无论从内容还是从结构上来看。其中Sanford的更加基础。 但是,我最推荐的是Freedman的StatisticalModels: Theory and Practice。 虽然这本书很便宜,但是它真的是物有所值。和很多的学究派的教科书不同,如上面两本,这本书本身是可以拿来当小说读的,语言非常口语化。读的时候,本身就有感觉是Freedman在亲自给你授课。这本书前半部分是讲回归的,很有特点的是书后面很大的篇幅是书中所提到的论文的原文,这样非常便于你随时查找相关论文的原文从而便于你理解。线性回归很多时候单讲理论的东西,非常晦涩难懂,但是一旦有一个实例,就非常容易理解了。而且本书的附录里面附有大部分难题的答案。还有matlab的code,相信想学matlab的童鞋可以参照这本书来学习。即学习了程序,也学习了统计,一举两得。这本书唯一的一个缺点是,内容过于精炼,所以可能学习来要查很多的资料才能够明白,不过前两本材料是很好的辅助材料。线性回归还是选取难点的教材比较好,因为是从上层来观察下层建筑,这样比较方便了解自己漏的部分。而且相信这本书语言的通俗性,也能让读者更清晰地领会到所需要明白的重点内容。再说下Freedman,本身就是位统计学界德高望重的老爷爷。他是UC-Berkeley的统计学教授,发展了Bayesians和Bootstrap 。相信学Machine Learning的同学都听该听说过他。他把统计学的研究拓展到了经济学,医药学,流行病学等等。这本书是2005年出版的,也是在他2008年去世前三年出版的,也应该算是糅合了他所认为的回归分析中最精华的内容。 5. R 语言的学习 原本上面已经提到了R语言,但是因为R作为一个工具的存在,可以让你更好地理解统计分析。我和周围的同学都没有刻意地去学习R语言。因为我们的作业都是需要用R 完成的,所以为了写作业,我们都逼迫自己在写作业的时候去学习R。但是,请大家务必把教课书中的R code弄明白。 主要的学习途径有这么几个: ① lab section 的R notes。教授的讲义和TA的讲义中所有用R 的地方都会在Lab section上重新演绎一次,我也会私下里再把R code重新compile一次; ② 做作业和讨论:感觉讨论在统计学中还是很重要的。一个好的统计专业学生,不但是做题好的,写code好的,更重要的是交流好的。好的交流着才能在交流过程中碰撞出解决问题的途径。同样,和同学讨论code才能帮助你理解。 ③ R help和google。 之前介绍了统计基础学习,相信如果大家按照上面的方法自学,应该会有一个不错的统计基础。但是对于大部分同学,学统计不是单纯地为了背概念和推公式。我一直都是喜欢应用性和实践性强的东西,这是统计的魅力所在。学了就能用。和很多生统和统计界的人聊过,他们说对于大多数专业来说,学到PHD学位,真正工作(如果不搞学术)中用到的东西很少很少。但是对于统计和生统专业来说,学校学习到的90%的知识都会在工作中直接应用。 好了,不扯这么多了,这章主要介绍下统计后期学习的各个分支。其中很多方面,我也是只有些接触,了解真的不是非常多。毕竟作为小本刚毕业的我知识有限,我就是尽量把我知道的资源推荐给大家。我也尽量不出错误,十分欢迎大家批评拍砖讨论。 a. 运筹学 至今为止,感觉到统计学分支之下或者相关的科目中上过的比较有意思的科目之一。一般本科阶段没有这个专业的设置,只是有选修课程或者方向。到了研究生阶段才会有单独的专业或者是单独的研究方向。但是据说单纯靠运筹徐就业得话,形势不是很好。但是,我总是觉得就业是看个人的,再差的专业,人优秀也能找到好的职位;再好的专业,也有出来找不到工作的孩纸。 其实从我对统计学的理解来看,我觉得运筹学蛮像哲学的,讲的就是在资源有限的前提下如何更好得分配资源,或者是在复杂的情况下,用什么样的方式能够解决问题。所以上运筹学的课程,乐趣是在于解决问题。当时上课的时候,做过两个project。一个是关于线性规划,另一个是关于MarkovChain的。 线性规划的课题设计是关于学校餐厅的配餐设计。当时找了50多种食材原料还有比较大众的零食,搜集了它们的价格和营养成分。营养成分包括卡路里,蛋白质,维生素什么的。目的是根据不同人群对食品的需求,比如肥胖人士,严格素食主义者,糖尿病患者,gluten 过敏人士等等,在这些要求下什么样的配餐能把价格压到最低。 Markov Chain的课题做的非常有意思,应该算是我大学阶段最有创造性的课题了:就是用Markov Chain作曲。当时找了我们学校音乐专业的学生用钢琴弹曲子。然后我们把每个曲子按照开头,中部,和结尾剪成三段相同长短的clip,再传送到java里面,通过改变transition matrix找到最合适的概率,演奏音乐。因为实在没有时间,只有两周,所以transition matrix是手工试的,否则应该有更好的方法。 强烈推荐一本针对运筹学的书:Operations Research:Applications and Algorithms 这本书涵盖了所有的operation research的topics,读起来算是直白清楚。不深,但是面广,对于想直观了解运筹学的孩纸是除了wiki以外最好的方式。 下面是三个运筹学的方向。上面那本书中其实都有讲,只是下面单独讲就更深入些。每个方向都有无数本书可以看。但是那些书大部分深奥难懂,还不如笔记清晰。如果在上面的书看了后,大家还有兴趣,下面是一些笔记可以看看—— Linear Programming 的笔记 Non-Linear Programming的笔记 Discrete Optimization b. Stochastic:运筹学下的一个分支 第一次接触stochastic是在大二的时候上经济学系下面的两门金融课程。当时我还在上人生中第一门统计课,其实那个时候除了概率其他的都懵懵懂懂的。Stochastic,当时选这课是因为stochastic和stock在写法和发音上面都很像。觉得stochastic就是讲股票投资的。后来才知道stochastic是随机性。但是不管怎么说,歪打正着学了个统计相关的课程。 这里想说个关于我对统计的感觉。从上面写的,大家知道我第一个确定的专业是经济。我属于凡事爱往复杂想的那种。其实这种性格的人,在学经济这种social science的初期是非常痛苦的。为什么呢?比如我大学第一个学期学的基础微观经济学,书里提到GDP。我就想GDP怎么算的啊,国家那么大怎么能保证这个GDP准确呢?然后书里出现失业率,计量经济学公式,书中种种事物,我都会质疑半天,最后自己就只好死记硬背,因为觉得所有的东西都讲不通。直到学了统计学以后,才了解到sample,survey和experiments design在social science的应用,也了解了计量经济学中的统计原理,才觉得经济书上的东西有理可依有据可循。所以说,统计还是一门很答疑解惑的学科。学了统计学,就可以相对容易地掌握很多其他学科的内容。 可能鉴于每个人学一门学科都是这种感觉:没有基础,学上层建筑是空的。所以,一般学习stochastic是先学习统计基础理论,再放回到金融理论中学习。或者很多人和我一样,先学的金融理论,再学习统计基础。我觉得哪种方法都有它好的一面和不好的一面吧,这个就要看个人了。 统计学中对Stochastic最有帮助的几个知识要点: ① 概率和条件概率:不多说,所有学科的基础; ② Poisson Distribution; ③ Random walk, Martingales and Brownian motion(密集型恐惧症慎入) ; ④ Markov Chain: 大家见“运筹学”; ⑤ Stationary processes。 经济学、金融学中的Stochastic的应用: Black-Schole Zivot的部分关于stock的笔记 虽然stochastic接触不少,但是真正深入的没有怎么学,都是基于统计学的。书就没有什么推荐的了。欢迎专门学这个的同学在小组中分享你的心得。大家如果对Stochastic方面真的非常有兴趣的话,不防看看CFA的教材。如果有机会,也可以选学金融工程方面的课程。应该还是很有意思的。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-07-07,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PPV课数据科学社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
机器学习5大数学知识(附详细课程资源)
机器学习理论是一个涵盖统计、概率、计算机科学和算法方面的领域,该理论的初衷是以迭代方式从数据中学习,找到可用于构建智能应用程序的隐藏洞察。
Ai学习的老章
2019/08/01
1.4K0
【经验分享】英国数据分析师讲故事:我是如何走上数据分析之路的?
我本科毕业于一个三流的二本院校,专业是三流中的三流—市场营销。大学前三年在各种游戏中度过,连兼职和实习的经历都没有。到大四的时候突然开始恐慌,觉得这样下去连工作都找不到了,于是立马开启了考研的节奏。可是突然发现已经三年没有学习的我再也难以重新捡起书本了,再加当时EX因为准备出国要和自己分手,我简直觉得自己到了穷途末路。
用户1756920
2018/07/23
7170
【经验分享】英国数据分析师讲故事:我是如何走上数据分析之路的?
一位数学专业女生大学毕业前的感慨:不好意思,是我天真了
问自己永远有多远!!!! 已知X是非平方数,证明X开根号是无理数 TM这还需要证明 学完定与不定积分后
IT阅读排行榜
2018/08/15
4290
Julia数据统计最全教程,代码图解全都有,昆士兰大学出品,公开免费阅读
在Quora上“Julia做数据统计有多好”的问题下,威斯康星大学麦迪逊分校的Yibo Liu同学评价说,用Julia做线性编程,不仅运行快,还能在Jupyter里实时修改查看运行结果。
量子位
2019/07/17
8090
Julia数据统计最全教程,代码图解全都有,昆士兰大学出品,公开免费阅读
概率论从入门到放弃?布朗学霸火到宕机的毕业作品,让统计“看得见”
黄白球在箱子里拿来拿去怎么也拿不到自己想要的,硬币抛来抛去也没有看到另一面,生日算来算去还是跟喜欢的人不一样。
zenRRan
2019/11/19
6230
概率论从入门到放弃?布朗学霸火到宕机的毕业作品,让统计“看得见”
作为一名大一新生专业是大数据专业, 应该从哪里开始入门学习?
首先你要有自己职业规划,知道数据分析和大数据是做什么的、能解决什么问题,给自己定一个小目标。一个有经验的数据科学家:最少要有2到3年工作经验,而工作经验体现在运用数据科学处理各种商业问题的能力上,同时需要具备以下技能: 一流的分析技巧:探索凌乱的数据集并提取洞察的能力; 在SQL运用能力方面是一名内行; 能很好的掌握假设检验、分配、回归分析和贝叶斯方法; 有与商业方面的机器学习经验; 对于Python语言和Jupyter环境有经验; 对于pandas、numpy、sk-learn和NLTK有一
小莹莹
2018/04/23
8490
作为一名大一新生专业是大数据专业, 应该从哪里开始入门学习?
我的数据挖掘之路——从菜鸟到实战
导读:作者wrchow是浙江大学计算机硕士,通过自己的努力终于拿到了心仪的offer(搜狗Web数据挖掘助理研究员),实现了从事互联网数据挖掘的梦想。他对数据挖掘这个行业的兴趣,以及为了进入这个行业所做的准备和努力,非常值得想进入这一行业的在校生或朋友们参考。 由于本科专业是生物信息(可以理解为生物统计学或者与基因数据相关的数据挖掘学科),所以那时已经开始接触数据挖掘,对统计也算有一定的基础。记得大二的时候,我便开始学用matlab,然后玩弄SVM,神经网络之类的机器学习算法做一些分析和实验。现在想
机器学习AI算法工程
2018/03/09
1.2K0
给计算机专业大一新生的一些学习规划建议
(零) 每个时代都会悄悄犒赏努力学习的人。 没有人生来就是主角,所有主角都是从龙套开始,一步一步脚印,把自己的路走出万丈光芒。 不少人在高中时候,尤其是高三的时候,会听老师说:高中是最辛苦的,辛苦了这阵,等考上了大学,想怎么玩就怎么玩! 这只是善意的谎言,不要当真。 假如你考上的是重点院校,你会发现很多人都在奋发学习,在这种氛围下你需要努力学习,才不会落后于你身边的同学。 假如你考上很普通的学校,会发现确实有很多人在玩。因为学校本来就普通,你更需要努力学习。 有些大一新生刚开始,可能在学习上会感到很不习
海天一树
2018/04/17
2.1K0
给计算机专业大一新生的一些学习规划建议
什么是大学数学(2)——三大数学专业辨析,常见数学学习路线
随着人工智能的兴起,它对数学的依赖也反复地被大家所提及。数学在互联网上的讨论也从来都没有停过。因此我计划写2-3篇文章,尽可能介绍大学/本科数学的全面貌,并与我自己的AI相关的工作经验结合,聊一聊它们给我们工作带来的启示。
学弱猹
2021/08/10
1.1K0
数据科学家的自我修养
编者按:谨以此文向著名统计学家、中国人民大学统计学院教授吴喜之教授致敬! 正文: 继云计算之后,大数据已然成为IT行业的热点。《哈佛商业评论》更是宣称“数据科学家”是二十一世纪最性感的职业。所谓性感,既代表着难以名状的诱惑,又说明了大家都不知道它干的是什么。这里我不想重复什么是大数据,什么是数据科学,而是直接从数据科学家这样一个神秘的群体开始让大家对大数据和数据科学有个基本的认识。 认识数据科学家 “数据科学家”是舶来语,翻译自英文“Data scientist”,用来描述“一些能综合运用编程和统计技
小莹莹
2018/04/23
9720
数据科学家的自我修养
【推荐】想学统计学需要掌握哪些知识?
这是一个很好的问题,对于新手、特别是非统计科班出身的人来说,心里总是有这样的顾虑,掌握的统计学基础只是不够,然而又应该从哪里入手呢?以下是中国统计网整理自知乎的一些答案,希望对大家会有所帮助。 @肖玄: 我认为首先要明确的是学统计干什么,如果有明确的作用,比如时间序列,市场调研这些,那么推荐书籍各不一样,统计终究只是一个工具,在实际运用中的偏重和变化还是蛮大的,如果不是有特别的目的,只是想要了解统计的话建议从理论基础看起,再看一些实际操作的书会比较好。 基础书籍,我看前面各位大师都
机器学习AI算法工程
2018/03/09
1.7K0
【统计学习】写给在学习统计的学弟学妹
在其他论坛看到一篇写如何学统计的文章,作者侃侃而谈,语言也不失幽默,更重要的是,平实的表述中却把很多读统计的童鞋共有的感受和疑问一同归纳总结了出来。楼主看过之后,觉得很有共鸣,特地贴过来让大家也看看: 统计学也不是什么神秘的学科,它的目的主要是通过数据探索信息,因此也就相应有一系列的流程:收集、整理、分析和表述(数据)。 1、收集数据 一般来说,数据的来源无非是试验和调查。平时我们谈统计学似乎不太注重数据的收集问题,然而试验设计和调查技术(包括抽样等)都是很有用的学问。若就纯粹的统计学院来说,试验设计的地位
陆勤_数据人网
2018/02/26
6400
00后当道,今秋开学的AI专业的本科生究竟学什么?
500万AI人才缺口,必须从本科抓起!正值开学季,不少同学在刚刚过去的夏天,选择了心仪的专业,即将迈入大学校门。上个月,清华、南大、西交大等26所高校联合申请设立AI本科专业,国内第一批AI本科大学生即将出现。
AI科技大本营
2018/09/28
5410
00后当道,今秋开学的AI专业的本科生究竟学什么?
为什么学人工智能首推Python 需要学习哪些知识
为何学人工智能首推Python?需要学习哪些知识?简单地讲,人工智能就是图像处理,数据处理,语言处理等多技术融合,在我们生活中经常可见。比如,人脸扫码付款,就是运用人工智能图像处理技术,机器人语言识别,常见的案例为第1个击败人类职业围棋选手的狗,包括在超市购物的扫码付款,都属于人工智能领域。​
一墨编程学习
2019/08/08
7620
为什么学人工智能首推Python 需要学习哪些知识
如何学习统计学
可能学习和工作还有兴趣都跟统计沾些边,一些朋友和网友也问我些如何学习统计之类的问题,他们当然一样是非统计出身。结合自己的学习经历,这里一并回答了,也权当一个成长备忘录,所以这里取一个柏拉图“《智者篇》
用户1756920
2018/06/20
5760
纪宏:统计人的 “统计梦”
编者按:“大数据”是这几年才新出的词,但“大数据”已经远远超出对数据本身的描述(人人皆知的4V或5V),也指数据处理过程,比如人们会说“这事好办,用大数据做...”,甚至是一个行业一拨人,比如有人说“我们是做大数据的...”。为何大数据兴起?因为其影响也远远超出IT行业,大数据和云计算不同,云计算解决的是IT架构的问题,面向基础设施层面,而大数据是面向应用的,只有与具体行业结合才是有价值的。因为技术的发展使数据的产生、采集更加容易,数据的量变了,形态变了,携带的信息也变了,因此对后续的存储、分析及展现的要求
大数据文摘
2018/05/21
8400
怒肝1.3w+字给学姐讲明白计算机专业大学四年到底该学什么?
网上已经有挺多关于“计算机专业大学四年到底应该学什么?”相关的文章了。不过,既然学姐问了我这个问题,我还是想再从我的角度来给她回答一下。安排!
五分钟学算法
2020/10/30
9170
怒肝1.3w+字给学姐讲明白计算机专业大学四年到底该学什么?
周志华主导,南京大学率先推出AI人才本科培养体系
5 月 6 日,南京大学人工智能学院院长周志华教授在微博上分享了的《南京大学人工智能本科专业教育培养体系》。
大数据文摘
2019/05/15
7750
周志华主导,南京大学率先推出AI人才本科培养体系
如何用3个月零基础入门机器学习?
来源 | 微调的知乎专栏 ▌0. 背景 写这篇文章的初衷是大部分私信我的朋友都想了解如何入门/转行机器学习,搭上人工智能这列二十一世纪的快车。再加上这个问题每隔一阵子就会在知乎时间线上出现一次,因此
用户1737318
2018/06/05
9270
高考志愿填报指南——统计学专业介绍
本文将系统的介绍统计学专业的专业概况、就业前(钱)景、就业方向、以及企业对招聘时对学历的要求、最后将谈一些自己的择校建议。
用户8612862
2021/07/20
7250
推荐阅读
相关推荐
机器学习5大数学知识(附详细课程资源)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档