05 统计:不确定性下的决策科学
统计学可以帮助你在各类不确定情况下更好地做出决策。当你在亚马逊或者淘宝购物时,其他用户的评论和对于商家的评级成为你决定是否购买该商品的一个参考因素。当你出门旅行时,当地天气预报的情况会是你决定带什么类型衣物的一个参考。从医学研究到各类实验,从不断环绕地球运行的卫星到无处不在的脸书或者领英,从*意民**调查机构到联合国观察员,数据每时每刻都在被收集,也一直被统计分析,然后形成一些影响着人类决策的结论。统计学则成为人们量化推理的必要工具和概念基础,学习统计学,你会了解很多现实生活中的现象形成或者结论得出背后的原因。
INTRODUCTION
【统计学专业简介】
统计学是一门科学,也可以说是一门从数据中进行学习的艺术。作为一门学科,统计学主要通过概率论建立数学模型,收集和整理所观察的数据,进行量化的分析、总结、解读、推断和预测,为相关决策提供依据和参考。统计学构成了所有研究方法的基础,其中包括实验设计、回归分析、概率论和抽样理论。无论是医学和遗传学等领域的重大进展,还是商业和公共政策方面做出重要决策所必需的定量推理,统计学都是不可忽视的核心。
统计学是一门在不确定性下指导人们进行决策的科学。它涵盖了基于数据和模型做出合理决策所需的所有内容。一方面,它包括研究或者项目的设计、数据的收集、数据的评估和管理;另一方面,它包含正式的统计模型,而这个统计模型是基于抽象模糊的现实和概率工具的。最后,统计推断的概念将数据和模型结合在一起,从而做出决策,并丰富我们对世界的理解。
你可能会喜欢统计学吗?
如果你喜欢数学、定量问题、钻研事物工作原理以及如何使它们更有效地工作,喜欢和数字打交道、智力游戏,那么你可能会喜欢统计学。
【申请统计学专业,如何提升申请竞争力?】
选课策略
·学生需要在校内的数学课程中获得尽可能高的分数;
·如果是国际预科证书课程(简称“IB”)、英国高中课程(简称“A-Level”)、美国大学先修课程(简称“AP”)等国际课程体系,则尽量选择统计学、数学等课程。如IB体系,则数学选择高阶(HL)课程;如果是AP课程,建议选择AP统计学课程。
考试策略
·考虑完成AP微积分、AP统计学的考试。
活动策略
·在校期间利用高中、大学或者社会资源进行统计或者数学建模相关的研究项目,并发表学术论文;
·参加康奈尔大学、哥伦比亚大学或者纽约大学等顶级名校的学分型夏校项目,并修读统计或者概率等相关课程,获得较好成绩,争取教授写一封推荐信;
·参加罗斯数学夏令营(Ross Mathematics Program)、加州大学数学与科学夏校(COSMOS)、斯坦福大学数学夏令营(SUMaC)这样的顶级数学夏校项目;
·参加统计学竞赛项目,比如中国高校SAS(一种数据分析工具)数据分析大赛、挑战杯等;还有些数学建模的竞赛,比如美国高中生数学建模竞赛(HIMCM)、国际数学建模挑战赛(IM2C或IMMC),其中也有涉及统计学知识的运用;
不管是人文社科还是理工科、商科的活动,都可以从中找出需要用到统计学的部分,积极参与这些活动,运用统计学技能在相关活动中做出贡献,体现在申请时的活动列表或者文书中。
【统计学专业毕业生职业和薪酬状态】
谷歌首席经济学家哈尔·范里安在2009年1月的《麦肯锡季刊》中曾表述:“未来十年最性感的工作将是统计学。因为现在我们真的有了免费且无处不在的数据。(统计学家的)优势在于能够理解这些数据并从中提取价值。”那么处于21世纪的当今,用统计学知识来发掘浩瀚数据海洋中的价值将是统计学毕业生的优势。
主修统计学的学生进入职场后将非常适合从事需要数据统计分析并基于理论挖掘数据背后的深入信息的工作。统计学就业前景强劲,根据美国劳工部的数据,2014—2024年统计学就业率预计将增长34%,这将使“统计学家”成为增长速度排在第九的职业。统计学家可以在许多领域工作,比如制药、金融、消费科学、医学、环境科学、农业、商业、教育、科学和工程以及社会科学。此外,统计学的就业前景包含但不限于从事数学家、统计学家、运筹分析人员、计算机程序员、教师、财政分析员、公司会计、证券分析员等职业。与此同时,统计学专业的学生也能为研究生学习做准备,从而未来在学术界、工业界和政府部门获得更多的就业机会。
根据美国劳工统计局的数据,2017年美国统计人员的平均年薪为84060美元,这包括生物统计、农业统计、商业统计和经济统计等领域的专业人员。
过来人分享——关于统计学的方方面面
>>嘉宾:赵嘉璇
女生,本科就读于威斯康星大学麦迪逊分校,主修统计学和数学双专业,辅修计算机科学,统计学荣誉项目毕业,目前为哈佛大学公共卫生学院生物统计专业硕士在读。
(下文赵嘉璇简称为“JX”,择由教育简称为“Z”)
◆Part 1 专业选择与学习
Z:你在本科阶段修读了统计学和数学两个专业,能跟我们谈谈当初是怎么选择这两个专业的吗?是高中就很明确了还是进入大学之后才明确的?你是如何判断自己喜欢统计学而做出这个决定的?
JX:我在高中阶段对于专业的认知也不是非常清晰,所以申请大学的时候选择的是商学院的会计专业,录取的是文理学院下面的“Undecided”,也就是不定专业,相当于是被调剂的一个结果。
择由提示
大部分美国大学商学院下设专业的申请对学生的要求会更高,竞争压力会更大,所以学生直接申请商学院的录取难度很大。
我当时申请商学院下的会计专业是因为认为金融或者其他商科专业比较火热,但对会计专业也没有很坚定的兴趣,所以在被录取了不定专业后,重新对自己的兴趣和专业方向进行了探索。后来我了解到有些商科的专业需要进行很多案例分析,就逐步意识到商科不是很适合我,因为我并不擅长文科分析。同时,在与学长学姐的沟通以及调研过程中发现,统计学是一门挺有用的学科,很多统计的工具和方法可以运用在实际问题的分析和解决上,并且统计学知识可以运用到金融、生物等领域,应用范围比较广泛,所以我在大一时就确定了统计学作为专业。
关于统计学的应用,我个人的理解是这样的:统计主要是收集数据和分析数据,在当今社会有着举足轻重的作用。如果一个人只会写代码,拿到数据之后并不知道这些数据要表达的意义,那么写出来的代码的作用也就有限了,而统计这个时候就可以发挥分析数据的作用。概括起来说,我在确定专业时主要考虑了两方面的因素:一是性格特点和兴趣,我比较喜欢这种分析性的、应用型的、有趣的学科;二是考虑到统计学的实用性,也可以说是它未来在就业方面的价值。
数学则是到大三确定的。因为我在大三时意识到一些数学的理论知识(比如逻辑思维)在统计的学习中非常重要,而且这种逻辑思维对于计算机科学的学习也同样重要,所以我决定完成一些数学课程,并将数学作为我的另一个主修专业。
本科统计学专业可以考虑辅修或者双专业的领域有哪些?
数学、生物、计算机科学、金融、经济、市场营销、政治学、供应链管理、商业分析、数据科学等。
Z:目前你学习统计学的经历已经超过了四年,这四年里你感受到的统计学专业跟你最初确定这个专业想象的内容有什么不一样吗?有些人会认为在数学、经济学或者其他专业的学习中也会涉及统计的学习,在你看来,系统地学习统计学专业的所有课程跟其他专业涉及的统计学课程,这两种学习方法的差异在哪里?
JX:有一点我最初没有意识到,那就是我在统计学的学习和应用过程中发现计算机科学技能对于统计学的学习是非常重要的。单纯的统计工具和方法不足以应对现在就业市场的需求,必须搭配计算机的一些算法或者是语言来发挥更大作用。我最初选择计算机相关的课程只是为了满足本科通识教育的必修课程要求,选择计算机科学作为辅修专业的时候也是因为跟风(笑),那时并没有意识到计算机科学跟统计学结合的重要性。直到大四我想找数据科学之类的实习时才发现,在岗位要求技能中,不仅有统计学技能例如纵向数据和时间序列的方法,而且计算机科学方面的算法、Python语言或者是机器学习的知识等也需要掌握一点,也在实际工作中认识到了统计学结合计算机的作用,因此觉得自己的确需要去掌握一些计算机的技能。
最初学习统计的时候学的都是比较基本的知识,就像大部分人小学就接触过“从盒子中摸出一个红球和一个蓝球的概率各自是多少”这类问题,的确有些枯燥。从大二开始,我们就会上一些把统计用在生活中的应用类课程。我记得当时第一门课就是教我们用数据建立模型,并且让我们指出该如何提高模型的精确性。比如研究失业的原因,那么我需要建模来证明哪些因素会导致失业。总体来说,在整个课程设置上,统计学专业在一开始需要学一些关于概念的理论性课程,比如分布(Distribution)等概念,到后期则会接触到统计的实际应用。


关于统计学课程的差异,虽然很多学习经济或者数学专业的同学也会上一到两门统计的课,但如果只是如此的话,一些高阶统计分析过程中就可能会出现误差或者是受到不全面的认知的影响。举例来说,我现在在帮一个教健康政策的老师做科研,做的项目涉及一个被叫作P值(P-value)的影响因素,如果我只学过初级统计,关注点就会集中在这个单项因素上,只关注P-value<0.05就会影响这个结果,P-value>0.05就不会影响这个结果,但这个判断是不准确的,因为还有很多标准和因素都需要被考虑到,比如公共常识,等等。
至于统计学专业和数学专业内包含的统计学的课程的差异,我觉得要看不同学校,有些学校的数学专业比较偏重纯理论数学,那么它即使会涉及一些统计学的课程,差异也比较大;有些学校的数学偏应用,那么可能的确会和统计专业的课程有比较多的重合之处。
Z:本科学习期间,跟统计学专业有关的最有趣或者最有挑战性的内容是什么?
JX:这个要从统计学的应用说起。读完统计学,我们可以走纯统计专业的路线,一直学习和研究理论统计,也可以向生物统计方面发展,或者是向金融统计发展。因为统计学中的很多方法可以被用于各个领域,比如时间序列既可以被用在金融领域,也可以被运用于其他领域,我比较喜欢的就是生物领域,这也是我认为学习统计学专业最有趣的地方。
统计学被应用于生物领域,可以让我透过数据去看待现象背后的规律。举例来讲,学习生物的人会把人的生老病死理解成细胞分裂之类的生理变化,但是从一个生物统计学习者的角度,细胞分裂这种现象会导致某些数据变化上升,进而导致人的心脏跳动次数上升,再进一步导致其他数据变化。对我而言,不是从身体机能角度去看待生老病死,而更多是从数据变化的角度来看,也就是用统计工具和数学语言来研究生物。从统计学角度去了解现象背后的整个数据的变化以及变化的原因,让我觉得很有趣。
对我来说,学习统计学的压力来源于我认知上的反差。最开始我以为统计学就是研究抽取红、蓝球概率这类无意义的话题,学习态度不是很认真。后来我发现统计跟现实的关联非常紧密,现实状况中存在很多不确定性和灵活性,需要考虑很多因素,这时我就发现自己的知识基础难以支撑研究这些因素。有时在遇到问题时,即使我去咨询老师,老师也不能马上判断出原因,或者给出一个合理的解释,这个时候就只能自己想办法、查文献。因为现实中的诸多不确定性都会影响数据,单单抽出一个因素是很难做出精准的判断,或者是找出非常绝对的理由,只能自己去看更多的资料,并且不断尝试,从而尽可能更全面地做判断和把握。
比如在大三的时候我上了一门数据科学的课,我们要用数据建模,我要研究的是天气状况是否会影响车祸死亡率。常规而言,大家都会觉得天气越恶劣越容易出现车祸,自然死亡率会上升。但令人诧异的是,当时调研的结果跟这种常识判断是相反的,结果显示天气越恶劣,死亡率反而越低。我跟我的合作伙伴对于这个结果非常震惊和困惑。当时老师也没有给出明确的解释,他只是给了我们一些有可能影响结果的因素,建议我们进一步去调查,比如是否那段时间政府的政策上发生了什么变化。我们的统计和研究涉及天气、政府修路开销等多种因素,但是依然有诸多人为因素以我们当时的能力是无法量化和更新到模型中的,只能等日后有更新的数据再进一步研究,所以对于这种不确定的因素感觉非常有压力。
再比如我们也尝试统计分析驾驶时间和交通事故率之间的关系,但这是一个长期的过程,这类长时间段范围内数据变化的统计我本科还没有学到,这也给我造成了一部分的压力。总体来说,现实生活中的统计会涉及很多不可控因素,本科所学习的知识有时不足以支撑我们做一个很完善的模型来进一步探究,这就是统计需要进一步研学的原因。
当然,大部分情况下的数据告诉的结果都是符合正常情况的,特殊情况出现的原因之一是我刚刚提到的不可控因素的影响,原因之二是数据样本的不精准性。比如有时需要大量的数据来建模,但是特定的阶段我们从同一个网站上不可能找到需要的所有数据,只能再从其他网站上找数据凑在一起,比如搜集政府修路开销就去政府网站,搜索死亡人数就去一些社会机构的网站。不同网站的数据来源可能参照标准、时间跨度都不相同,我们只能先将数据进行一轮处理然后再来使用,但这也会对最终的结果产生影响。比如我做的天气与车祸死亡率的统计,一个数据是一个季度的死亡人数,另外一个数据则是一年内政府投入的修路资金,这两个数据的时间周期并不相同,这种情况我没办法对比,只能将年度数据除以四或者是季度数据乘以四来使用,但这也会影响数据的准确性。一般在数据来源都比较标准并且来源于同一个全面、权威的网站时,统计分析的结果准确性才会更高。
Z:你有一段本科荣誉学生科研的经历,就是统计学被运用到生物领域的,你也多次提到你对统计学被运用到生物领域的兴趣,可以讲一下这个兴趣的起源吗?另外,你是如何获得这个研究经历的?统计学专业学生在本科期间要获得类似的研究机会难度有多大?
JX:日常上课时老师会让我们接触一些研究项目,但基本都是拿来练手的类型,例如从网上*载下**数据建模,然后根据建模结果做图表形成一份论文上交,我们并不知道项目做完的效果和对错,所以没有太大的实际意义。于是,我想找一位导师跟着做一些“真正的”科研。我在学校官网了解后找到一位统计学老师,他有一些研究项目是金融方向的,就向这位老师提交了申请。但是这位老师建议我跟着他做关于脑成像,也就是大脑扫描相关的项目。他提到现在金融相关的科研已经太多,反而是统计学被应用在医学领域还没有那么发达,未来会是一个很好的发展趋势,因为无论贫穷或者富有的群体,都会去关心自己什么时候可能生病。于是我就跟着导师做了这个科研项目,也算是阴差阳错进入生物统计这个领域。
本科期间可以获得科研机会,大部分的项目是只要提出申请就可以去做,主要看导师是否愿意带你。一般的流程是先在学校网站上看导师的介绍,看自己是否对这些老师的研究领域感兴趣,然后去跟老师联系表明自己想要做科研的兴趣,获得老师的同意之后就可以跟着他一起做了。
择由提示
想要在本科期间获得科研机会也有相应的方法可以遵循。学生需要主动去探索自己的兴趣并且主动去了解教授和他的研究课题,并和教授沟通交流,主动询问是否有相关机会。
另外,要获得我们学校的荣誉项目毕业,除了要满足本专业的基本毕业要求之外,还需要同时满足以下两点:第一是总体绩点成绩(GPA)和专业GPA都在3.5以上;第二是修两门荣誉课程拿到B以上的成绩,加上一门3个学分的统计高阶选修课,或者在一个统计学老师的指导下完成两个学期总共6个学分的统计学研究,我所做的这个关于脑成像的荣誉学生研究项目就刚好满足了第二个要求。所以这个项目也是我最后以荣誉项目毕业的重要前提。
择由提示
美国本科的Honor Program(荣誉项目):很多美国大学会为本科生开设荣誉项目,荣誉项目是为了给学生提供更专业、更高阶、更高难度的学术资源,充分满足学生的专业发展和提升。不过,很多学校的荣誉项目模式都不太一样。有些荣誉项目独立性极强,会有独立的课程、独立的科研机会甚至独立的宿舍;也有一些学校的荣誉项目是类似于嘉宾所完成的,满足学校的GPA要求并完成额外的科研要求。
我参加的这个科研项目持续了两年,收获也非常大。项目的主要内容是通过研究脑成像来找出可能导致阿兹海默病的潜在大脑区域。做这个项目让我看到了统计学更广泛的应用。一般课堂上老师举的统计学应用的例子都是与金融或者生活中的现象结合比较多,做这个项目让我看到了统计学在生物领域中的巨大作用。其实我高中的生物课程学得也很好,也曾经想过学医,后来是考虑到学医的语言压力太大才放弃的,做了这个项目也相当于是阴差阳错地给了我一种延续梦想的机会。
Z:威斯康星大学麦迪逊分校的统计学专业本科阶段是否有分支方向?你们学校的统计学专业有哪些授课方式和考核方式?
JX:学校提供统计学的文科学士和理科学士两个最基础的分支。我们在学习的时候是没有分支的,只是在大家学习完以后会根据自己的兴趣去应用于不同的领域。比如我刚刚提到的有些人会继续学习纯的理论统计,有些人会转到金融统计或者生物统计领域,还有一些人会从统计学转到计算机科学去做机器学习的研究。
关于考核方式,初级阶段的课程一般是比较基本的考试和作业,都是做理论题目的形式;到了中级阶段,除了基本的考试和作业,还会再加上课题项目。课题项目有个人独立的,也有小组合作的,一般是建模分析数据,完成一份涵盖图表分析和结论的报告,有时候老师也会要求做演示,老师和同学会针对演示提出问题。

Z:就你的了解来看,美国不同大学之间本科阶段开设的统计学专业有什么不同的特点吗?
JX:据我了解到的情况来看,有些大学的统计学会比较偏数学,统计学直接开设在数学系下面而不是独立的系,学习内容更偏理论,例如会涉及大量的证明等理论题目。我们学校的统计学课程比较偏应用型,所以有独立的统计系,有系统的理论和实践的学习。这种偏应用的特点一方面体现在授课方式上,就是我们后期的学习会研究很多实际生活问题的项目,一方面还体现在学习的内容上,我们很清楚我们学到的知识可以运用在哪里,比如时间序列是可以运用到股票等金融领域的。
择由提示
美国大学本科阶段所开设的统计学专业一般分为两大类,一类是偏重于理论研究,一类是偏重于实践应用。有些学校有独立的统计系,有些学校的统计学则是被设置在数学系下。此外,并不是所有的学校都开设统计专业。
哪些学校的统计学专业比较出色?
斯坦福大学、加州大学伯克利分校、哈佛大学、约翰霍普金斯大学、芝加哥大学、华盛顿大学、*耐基卡**梅隆大学、北卡罗来纳大学、密歇根大学安娜堡分校、杜克大学。
Z:从自身经历和观察来看,你觉得什么样的人(比如具备什么样的能力、兴趣爱好或者性格特质)适合学习统计学专业呢?
JX:我个人认为学习统计学首先需要数学能力突出。统计学归根结底还是讲究逻辑的思维和方法,它会涉及很多公式推理,尤其是选择的课程偏理论的话,更需要较强的逻辑推理能力。
此外,统计学跟计算机科学的联系比较紧密,所以如果选择统计学专业的话,最好对计算机科学也不反感;如果对于计算机科学深恶痛绝,我的建议是不要学习统计学,否则,到了统计学的高阶应用领域也会受到限制。
性格特点方面,我认为统计学专业没有什么特殊的要求。因为从就业的角度来讲,统计学的应用非常广泛,性格内向的话,学完统计学可以从事一些研究工作;如果性格外向,也可以转向金融领域做金融分析师等。但不管是内向还是外向,我觉得学习统计都需要有一种对新鲜事物的好奇。对于数据和数据分析产生的结果的好奇会驱使我们进一步思考,究竟是什么原因导致了这个结果。比如面对一个统计分析出来的结果,要主动思考它是否是正常的;如果不正常,是数据来源不同或者什么特殊情况影响了结果,要有进一步去挖掘、研究数据的意愿。也就是说,我认为具备好奇心的人更容易对生活中的现象产生要用数据去分析它的冲动。
你具备读统计学专业的能力吗?
如果你擅长倾听、注意细节、批判式阅读/思考,喜欢数学、定量分析、调研、团队配合,或者具有耐心、写作技能,请考虑统计学专业。
如果你喜欢统计学,那你可能也喜欢以下专业:
会计学、信息系统、遗传学、经济学、数学、计算机科学、健康信息管理。
◆Part 2 未来职业与发展
Z:你在本科阶段结束之后开始了生物统计的硕士学习,同专业其他同学的去向如何?当前就业市场上对于统计学专业学生的需求是怎样的?国际生和美国本土学生在这些方面有明显区别吗?
JX:据我所知,我们专业本科毕业后直接就业的不是很多,因为很多公司会认为统计学在本科阶段没有学到太多实践的东西。我当时毕业找实习的时候就看到很多公司要求研究生学历。个别本科毕业直接就业的薪资也不是特别高。美国本土学生本科毕业后直接就业的会偏多一点,因为他们不存在因为身份原因找工作的困难。
不管是本土生还是国际生,就业时进入金融或者计算机行业的比较多。比如有位同学进了保险公司,还有一位统计学和计算机科学双专业的同学找到了一家计算机公司的工作。因为纯理论统计的确不好就业,所以我有很多同学会选择双专业或者辅修。像数学、计算机、金融等都是常见的跟统计学一起组合的专业方向。我们这几届在申请研究生的时候也会选择与其他领域结合交叉。前几届大多与金融领域交叉,从我们这一届开始就有很多人向数据科学和生物统计方面发展了,也有一部分在研究生阶段继续统计的理论学习,但是基本到博士阶段也会转向金融等其他领域。

Z:可否透露一下你硕士毕业后的长远规划?
JX:目前的打算是毕业后先到制药公司从事生物统计相关的工作,几年后再根据工作的状况来看,需要的话会去读博士。
Z:回顾本科阶段的学习,你觉得自己最大的收获和遗憾分别是什么呢?有没有要给后面学习统计学的学弟学妹们一些建议?
JX:学习了统计学专业之后,我最大的收获是可以选择的学习和就业范围都更广了。就像我前面多次提到的,统计的应用范围比较广,所以我具备了统计学的知识之后研究生可以选择的方向有很多。如果有些学生到了大三必须要确定专业时还是无法决定自己想要学习什么,我个人觉得可以学习统计学,因为日后想要改变方向的话,统计学的选择范围会比较广。如果想转数学专业,统计学跟数学有很多重合的课程,转起来比较容易;如果想转计算机科学专业的话,统计学中涉猎了一部分计算机课程,也可以转;如果想转到金融方向,可以提前修读一部分金融理论知识的课程,之后转到金融统计这个方向。
我自己的确有一些遗憾,因此给学弟学妹们一些相应的建议:
第一,一定要把理论基础打扎实些。最初学习的时候我认为理论知识不重要,更多去关注实践和应用,但是到后面认识到,理论基础不扎实,做研究和建模时都会存在压力。
第二,提升计算机能力。当今计算机和大数据非常重要,如果计算机能力不好,不能将其作为统计学的有效助力,那么之后统计的应用也会受到一定限制。
第三,在满足基本的学业要求后,在本科期间做一些科研。虽然这不是学校的硬性要求,但是科研是提升自己能力的很好方法。建议跟着导师一对一做那些长达一到两年的科研项目,或者是争取参与导师的一些博士生小组的科研项目,甚至是发表一些论文。这些事情研究生做得比较多,本科生如果主动争取也是有机会的。
第四,充分利用学校提供的资源。大学一般会组织一些数据建模比赛,还会有统计学的社团,建议学弟学妹们尽量多参加这些比赛和社团,一方面进一步提升自己的专业能力,另一方面也可以认识一些专业技能非常厉害的人物。这个方面我原来做得比较少,现在有些遗憾。