上周出差到纽约,参加了一个数据科学和统计学的学术会议。很有收获。(哈哈,拖延症犯了,今天才把总结写出来~)
先谈谈会议流程和会议组织
会议时间挺长的,周日晚上注册和晚宴;周一到周三,每天都是满满的会议安排(早七点半到晚6点半或者更晚)。每天早晨要起的很早,洗漱,打车到开会的地方,抓一些主办方提供的咖啡和蛋糕,就去听讲座了。每天上午和下午的工作,主要是讲座,分成大牛的讲座和普通人的讲座。大牛的讲座规格比较高,在四五百人的大礼堂,大家也都会去参加(同一时间没有别的安排)。而普通人的讲座包括教授(2/3),博士/博士后(1/3),工业界的演讲者(较少)。因为本次大会规格较高,参与人数较多,同一时间会进行5-8个不同的主题(在不同的地点),大家根据自己的兴趣进行选择旁听。晚上有一些主办方组织的学术联谊,主要针对学生(教授们比较忙,也不愿意花时间做这些事)。
这个会议叫SLDS2018(统计学大会2018 -非参数经典数据科学研究)是由美国统计学会组织,哥伦比亚大学承办(今年)的一个两年一次的大会。会议的参会人员分成三部分:1被邀请,多为领域内的领军人物;2向大会投稿发表文章和学术海报,经审,被录取,参与(我在这一类);3自愿报名参与。第一类免费,第二类费用较低,但需通过学术评审,第三类费用高且有人数限制。
根据我个人的不完全统计,会议学者主要来自美国高校,包括哥大,uiuc,mit,斯坦福,康奈尔,psu,nyu等;美国之外,有一些中国香港的学者,来自包括中国香港城市,港大等。与会的国籍很有意思,中国学者约多于1/3,印度学者约少于1/3,其他国家约1/3。
浅谈学术部分
会议本身作为统计学会议,对于数理和统计的基础要求非常高。整体来看,偏保守:人们普遍讨论更多的还是概率模型,经典统计推断,随机模型,优化模型等话题;对于信息可视化,机器学习,数据重复性的研究有涉及,但不多;对于在cs(计算机科学)领域比较火的强化学习算法,深度学习算法,lstm等,完全没有涉及。
与会的两位大牛(全员讲座级别)一位来自学界(70+),一位来自工业界(50+),代表了不同方向的声音。我个人非常崇拜学界的这位大牛,一直是我的一个偶像,MichaelI. Jordan,他是LDA之父,EM大师,同时也是吴恩达的老师!他的报告深入浅出,讲述的很精彩。他认为未来一个十年,全局优化(convex optimization)会是学科研究重点。(比较遗憾的是,他的报告的最后1/3我没能听懂,太难了……)
根据了解,统计学在不同学校的地位不同,大家研究的方向也有所差异。内容而言:包括基础研究(统计,概率,随机,数值计算),优化(火),推断,数据有效性,统计模型,统计新方法等。学科设置以及研究内容而言:包括金融统计/金统(数理,应用),生物统计/生统(时间,空间,多元,大数据);数据统计(比如我,哈哈)
我是全场为数不多的非统计学专业背景的与会人员。在会场上找到uiuc统计学的博士生/教授群体之后,跟大家一起学习生活的挺开心!哈哈!
之后是一些个人感想
其实,我已经参与过好几次会议了,身份也分别包括:打酱油的(自愿报名参与),大会组织者(工作人员),大会报告者。这几个身份里面,越往前,越爱看热闹,越关注整个大会,当然锻炼了组织能力;越往后,学术层次越高,对于会议本身反而不那么在意,更在意的是和自己研究相关的部分吗,几区的有用养分更多。
通过这次大会我还仔细观察了不同层级学者的心态与收获。
低年级博士生(1-3年博士):更多的是学习的心态,横向了解。有一些能够如数家珍,对于专业和人有基本认识,对研究有基本热情。是大会的观察者和接收者。这个层次的社交意义不大。
高年级博士生:关注学科最前沿状态,什么都懂,能够细数不同方向利弊、算法细节、学校/学者特色;是整个学科的核心力量;也是联系不同人群的纽带。
博后/初级教授:参会的心态是为了关系网。他们的主要是获取途径是自我阅读。他们只关注自己的领域和相关文章。他们随时在关注新的教职机会。
高级教授:他们不差钱。他们研究不动手。他们已经是“从心所欲不逾矩”的状态。所以来开会更多是看看学科研究的方向,观其大略。
大牛:作报告。离开。很忙。通过报告,看得出,理解的深,做的好,依然在科研最前沿。
怎么说呢,学者的科研生命挺短的。大概最有活力的是高年级博士到初级教授的几年。
最后是一些自说自话(自评和自我职业建议)
参与这次大会学习到很多,收获也很多,但是看到的差距也很大,沮丧也很多。
我不是统计学专业。通过这次参会,我切身感觉到了和统计学生竞争的感觉。坦白讲,二年级博士生和其他高年级博士或者教授,差距太过显著了。更何况,这是一个统计学术年会而我并没有统计背景!我明显感觉到自己拥有非常强的编程优势,非统计部分的专业优势(数据库,文本挖掘),以及实习经验带来的工业生产优势,即使是对比初级教授,我依然拥有上面的优势。不过我刻意不谈,我想在理论上和统计方法上战胜他们。主要的差距还是在积累和理解。他们对于统计的基本理解还是更深,更熟悉。此外,我自己适应新环境的能力很不错,很快跟大家打成一片,没有认生,甚至形成了局部的威望。
目前我的状态是信息科学博士二年级结束(未开题)。仅就统计学而言,我属于2年级统计博士的中游水平(65分——达标,但不拔群)。我希望自己在毕业的时候能够达到统计专业博士毕业生的上游水平(85分)。我需要自觉锻炼的包括:数学基础(特指线代和推导计算功力),知识理解深度,知识宽度(子方向和子学科),人文与新进展。
我所属的信息科学是交叉学科,涉及统计科学,涉及计算机科学,也涉及一些我们自己的数据科学。我希望自己在和这两个专业的同学的专业竞争中,不落下风。这不容易,但是我要做到。处在交叉位置的尴尬除了“什么都会,但都不精”之外,还有一个,就是缺乏归属感,这里不做展开了。但是他的优点是复合型,全能——实际上对人,对知识理解,对沟通能力,对解决问题能力,有更高的要求。
此外,我深深地看到了统计学内部的人员饱和情况。中国人的数学真的好,但是学界竞争太过激烈了,过饱和下面,没什么好的机会。可能的出路是1)苟活;2)去工业界(药厂,金融界,科技公司);3)学科交界的位置找的新的生机。于我个人而言,我永远为自己的土木工程背景而感到骄傲,但是怎么能够结合的巧妙。是一个足够有意思也很重要的话题,值得我在今后的几年,甚至十几年内反复思考。
最后,学院已经出资为我报销了此次出行的全部开销。我回来之后也特别发了邮件,介绍了自己的收获,并表达了感谢。在此再次感谢。
领取专属 10元无门槛券
私享最新 技术干货