统计的乐趣在线观看完整版 (统计的乐趣中文语音)

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

BBC纪录片《统计的乐趣》于2010年出品。

当下,人类正被机器人Ameca,以及ChatGPT惊掉了下巴,还看12年前的片子有意思吗?

就是看了。

若与旋风般进化的AI相比,不刺激,不惊艳,被比得渣都不剩。

但我觉得它像一位智者,从远处慢吞吞地走来。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

1.

什么是统计?

简单说,也许就是把混乱无序的海量数据按照一定规则和需求条理化。

其过程可想而知,跑不掉的枯燥乏味。

但罗教授说,不会。那些眼花缭乱的表格,晦涩难懂的术语已消失,应用于各种统计的数据系统已经宛如艺术般妙趣横生。

罗教授是瑞典卡罗琳学院的教授,全名汉斯.罗斯林Hans Rosling,是这部片子的出镜主持加旁白。

他的专业在国际卫生领域,却坚称自己迷上了统计学。属于不可救药的那种。

他认为,统计学是现代科技的基础,既是掌握世间万物规律的利器,又是衡量事物准确度的标尺,还是破译日月星辰,让幻想落地的手段。总之是无坚不摧,无所不能。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

2.

纵向看,统计学的统计方法大约有200多年的历史,逐步经历了数据的收集整理,图形生成,可视化,相关性分析等等阶段。

横向看,日常生活,社会市井,各种研究,覆盖之广,雪泥鸿爪,到处都能涉及到。

统计的视角是独一无二的,犹如滤镜。

通常认为男人驾驶技术比女人好,但从交通事故死亡率来看,男性几乎是女性的2.5倍。

世界各国人均寿命的统计分析显示,到了1970年, M国人的健康程度不如印度喀拉拉邦人。

瑞典的政治,经济,军事在欧洲十强中排第七;软件开发,汽车制造,核反应堆,远程通讯,以及医药位于世界前列。船舶只数,麦当劳店铺,个人电脑,在欧洲也算人均第一。

比较值得炫耀的是“每9个人有一条船”。不知是游轮,还是小舢板?那又怎样?不管大小,总之是有一条。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

3.

沿着罗教授的思路可以知道,如果用统计方法打开公共数据的大门,就能让公众获益。

M国旧金山市公开了所有领域的163套统计数据。

社区*会集**时,市民们带上地图资料,说明他们想要什么样的保卫服务。警方会听取建议,予以改进。因为公开的数据能说明警方工作是否卓有成效。

通过一张公开的旧金山犯罪地图,可以了解到,所在街区的治安,以及地段与犯罪率之间的关系。

*品毒**交易,酗酒卖淫,袭击抢劫,盗窃破坏,犯罪高发地段,安全地段等等,都会在地图上详细标注。

这张地图公布了当年旧金山市民遭遇*力暴**犯罪的几率是1%。其规律是地势越高,犯罪越少;而路段平缓,犯罪率则会陡然上升。

旧金山首席信息官chris Vein说:公共数据透明化,能落实市民的知情权,敦促政府相关部门负起责任,有利于城市的规范管理。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

4.

罗教授说,统计方法的基础是数据收集。在这一方面,瑞典领先于欧洲各国。

也许罗教授是瑞典人,多拿瑞典举例,还很是为之骄傲。

1749年以前,瑞典人自以为有两千万人口,沉醉于“我们是北欧军事强国,足以抗衡英法”的梦幻而自鸣得意。人多力量大嘛。

然而,瑞典统计局的前身,瑞典报表局提供的数据却打破了幻觉:不但人口只有200万,而且国力也弱得可怜。

政府警觉起来,不想再稀里糊涂地过日子。立即实施改善国民体质的健康计划,瑞典国力从此翻开了新的篇章。

200多年过去,瑞典报表局积累了极为详尽的个人信息。从出生,结婚,到去世都有据可查。

剑桥大学公众风险专业教授大卫.斯皮格尔哈尔特说,统计学就是政治算术。做好统计,就可以改善城市管理,把握城市的发展趋势。

19世纪,整个欧洲都意识到统计的重要,对所有能统计的领域都进行了统计。

英国后来者居上,把欧洲优秀的统计学家纳入麾下,创建了伦敦皇家统计学会。

1842年,皇家统计学会创始人之一,数学家查尔斯.巴比奇在阅读了诗人丁尼生的作品《罪恶的现象》后,无法控制自己,给诗人写了一封信。

先抄录原句:“在晨曦之前觉醒,每一刻都有一个生命逝去,每一刻都有一个生命诞生。”

然后委婉劝说,由于人口在增长,您的这一句应改为,“每一刻都有1又1/16个生命诞生。确切讲是1.067个。”

巴比奇先生可能不太懂押韵,但作为一名认真而尽责的统计学家,当之无愧。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

5.

数据收集之后,就是分析,否则数据再多也没有意义。

在数据分析中,最先受到青睐的是平均数。

国民收入,家庭成员,碳排放等等。把一大堆数据平均,拉齐个体差异,便得到一个易于掌握的平均值。比如,瑞典成人的平均身高,男的是1.779;女的是1.646。

伦敦大学流行病学教授米歇尔说:有些极其恐怖的事件,其实是一个固定不变的常数。

某篇报道说一位老人开车时要踩刹车,却不小心踩到了油门,把他的朋友撞死在一堵墙上。另一篇报道说,一位没有驾照的年轻人,吸毒和酗酒后上路,结果撞死了一个行人。

这样惊悚的个案,被包括在每年交通事故死亡人数的总和里,而每年交通事故死亡人数的总和,又几乎是一样的;男性是女性的2.5倍;比利时的交通死亡率是英国的两倍。

所以,在累计了大量独立事件之后,个案就成了社会现象里的一个数字。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

6.

平均数得到青睐,但对异常值却不敏感,不能反应全部真相。

比如,瑞典人均1.999条腿。因为有些人只有一条腿或者没有腿。而谁都没有三条腿。所以,个体异常与平均值一样重要,不容忽略。

而此时,能够描述这种状况的统计图应运而生。

这种统计图,可以直观个体与平均数的差别,以及最大值和最小值的差距。

数据在统计图中一次又一次地反复出现某种形状,叫做它的“分布”。这是达尔文的表兄,统计学家弗兰西斯.高尔顿发现的,他把这种形状命名为“正态分布”。

“正态分布”适用于很多类型的数据,不论是手臂长度,还是肺活量大小,或者是考试成绩等等。

之后,一些统计学家又相继发现并命名了其它形状分布,比如泊松分布。

泊松分布描述了不寻常事情的发生概率。

假设伦敦某个公交车站平均1小时会来3辆公交车。因为不可能每小时都恰好有3辆。通过泊松分布可以知道,在任意1小时内,能等到4辆、5辆、6辆或者完全等不到公交车的概率。

19世纪末的每一年都有普鲁士骑兵被自己的马踢死。有些年份一个也没有,有些年份有一个,有些年份有两个,有一年有七个.而不管每年到底有多少,普鲁士骑兵被马踢死的数据还是妥妥地符合了泊松分布。

统计分布,是深入事物本质的化繁为简。且直观,易于公众接受。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

7.

19世纪50年代,白衣天使佛罗伦斯.南丁格尔在克里米亚照顾英国伤员时发现,除了战场牺牲的以外,还有更多人死于肮脏的医疗环境。

她花了两年时间,统计战争中的死亡人数。标注在极区图上,蓝色扇面代表死于可预防人数,红色扇面代表战死,黑色扇面则代表死于意外。

战争结束后,她说服政府成立了皇家调查委员会,以解决战地医疗条件恶劣的问题。

南丁格尔的统计图在150年后被奉为经典,引起了一场护理保健与卫生的革命,从而挽救了无数生命。

她曾说:如果想要理解上帝的思想,就必须学习统计学,因为统计学就是在测量上帝的意志。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

8.

科技发展日新月异,也促进了统计方法的不断进化。比如数据可视化的出现。

数据设计师大卫.麦克坎德莱斯发现,媒体报道中经常出现“五千亿英镑用于战争预算”,“五百亿英镑用于原油泄露”等等几十、几百亿这样的大数据表达。公众脑子却一下绕不过弯儿来。

于是,他设计了以10亿英镑为比例的财政开支图,并收集各类新闻中的信息数据代入。

这就是数据可视化的雏形。

罗教授团队收集了12万个数据,通过计算平均值,分析分布,得到了200多个国家,各自在200多年来的变化发展趋势。

数据可视化,能直观清晰地显化统计结果,其中的规律性昭然若揭。

这就把一种形而上的东西,做成眼见为实的东西,有些像诺兰电影里的四维表达。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

9.

统计方法最重要的部分是相关性分析。

剑桥大学公众风险专业教授大卫.斯皮格尔哈尔特说,相关性分析的内容是,除了关注某个事物之外,还要观察这个事物与其它事物的关系,以及它们是如何相互影响的。

二战后不久,英国医生Richard doll调查了20所伦敦医院里的肺癌患者,找到了肺癌原因,就是吸烟。

为了验证这个结论,他发起了有史以来规模最大的烟民统计,全程追踪4万名英国医生。不仅证实了吸烟与肺癌有相关性,还证实了戒烟能够降低患癌几率。

伦敦大学流行病学教授米歇尔说,“科学家在进行相关性分析时,会尽他所能去否定所证命题。尽力证明它是错的。最后,如果反驳失败,而这个命题没有被*翻推**,才可以谨慎地说,这可能就是正确答案。”

有了数据,只是对这个世界的了解。它的底层逻辑是什么,背后的因果是什么,相关性分析都会深度挖掘,给出答案。

无论是透过现象看本质,还是抓住本质看现象,相关性分析都赋予了数据生命,让它们活了起来,令人一睹从未见过的风景。

伦敦大学流行病学教授米歇尔说:统计不能取代思考。而相关性研究就是去思考。思考统计数据所揭示的本质是什么。

因而是不是可以说,如果以“相关性分析”为界,前期行为是被动的,而之后就是一种主动的创新*行为性**。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

10.

数字时代是信息爆炸的纪元。

比起“鸡犬之声相闻,老死不相往来”的农耕文明,每个人获得的信息量增长了6000倍,空前浩瀚。

截止2009年,若把网上的数据总量打印后分成90份,每一份的高度等于地球到太阳的距离。

微软研究院计算机科学系主任斯蒂芬.埃莫特教授说,一个细胞有6英尺长的DNA,而一个人的DNA加起来有121英里长。

不可想象。

当今的统计方法业已不是结绳记事,也不是一笔一划书写,而是打包交给信息技术去处理。

比人工操作,机器更能干,更有效率。

Google研究总监彼得.诺维格说,把文件、网页、图像整理归档,然后寻找这些数据之间的规律与关联。尽管是机器在做,那也是一项规模巨大的统计工程。

这项工程涉及语言翻译,而在2010年以前,Google就可以胜任57种语言互译。

诺维格认为,机器翻译与语言识别两种技术都依赖统计方法。一个是语言信息的统计,一个是声音转化为文字的统计。将两种技术结合,就能实时翻译,实现两个不同语种的人直接对话。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

11.

地球人生活在一个有着2000亿颗恒星的星系。

无数传感器时刻监视着气温、水量、洋流。各类卫星也不断地拍摄云雨变幻,森林覆盖和积雪冰层。

研究环境,其实就是靠测量与观测。

而测量与观测,就是实时记录。然后,把这些实时记录的数据,进行整理,分析和处理。得到想要的规律性。

天文学家们探索太空,也是从收集观测数据做起的。

数据是揭开宇宙之谜的丰富原料,反过来又深刻影响着天文学自身的发展。

加州大学天文学家康妮.罗科西说,在一个星系中,有数以亿计个恒星。所以,合成一张完整的星系照片需要庞大的数据量,且需要曝光几千张巨型底片,而这个过程要25年时间。过去条件不具备,研究进展缓慢。

20世纪90年代诞生了数字天文学。观测太空的手段变成数字设备,数据收集总量大幅提升,一次可以拍摄大量恒星。

在新墨西哥州,一台带有大型数字传感器的天文望远镜,到2010年,已经实施 “斯隆数字巡天计划” 8年,其工作内容,就是观测收集太空数据。

“斯隆数字巡天计划”获得了天文史上最完善、最深入的观测数据,不仅涵盖银河系,还包括其它星系。它以前所未有的清晰度完成了图片合成,并在互联网上公开了全部数据。

通过这些数据的统计结果,已经辨认出无数未知星体与星系。原因是被融合星系的运动速度,与其它星体明显不同。

银河系就是一个通过缓慢而曲折过程逐渐吞并小星系的大星系。它在无数次融合了小星系之后变得越来越大。

由此,证实了“星系成长假说”成立。

2015年,新型的巡天望远镜投入运行,把斯隆望远镜远远甩在后头。

斯隆望远镜8年拍到了天空的4分之一,而新型望远镜3天就能扫描整个天空,并且更加清晰。

累计观测数据,深入认识星系演变过程,反过来,又不断刷新着天文学理论本身。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

12.

微软研究院计算机科学系主任斯蒂芬.埃莫特教授说,如今是科学、计算以及统计学的全盛时代。统计学本身就是以数据研究为核心的科学。它的发展,使得理论不再依赖于假说或实验。

人工智能成千上万次地创建了无数个平行世界,去模拟符合自然规律的生态系统,而每一次的模拟都离不开统计分析。

科技设备的计算能力也已经实现了数据规模代入,结论自动生成,无需人工干预的目标。

而所有假设、理论都要接受检验,经受过滤。以至被剔除,被出局。又令人有 “数据面前,人人平等”的感觉。

因此,各门类与统计学是协同进步的,它们相互促进,相互支撑。谁离了谁可能都不行。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

13.

微软研究院计算机科学系主任斯蒂芬.埃莫特教授认为统计学是一种抽象的理论。但对思想,情感,精神这些事情也能计算。

斯坦福大学计算机科学教授卡姆瓦尔则尝试利用互联网去探寻人们的内心。

他说,人们对互联网的依赖,留下了痕迹,用统计学方法分析这些痕迹,可以帮助人们更积极地理解生活的意义。

他的团队,抓取和摘录了网上所有以“我感觉”开头的词汇:很好、开心、正确、愧疚、不舒服、糟糕、抱歉等等词汇。

将这些词汇按照年龄、性别和地理位置放入数据库,分组测试,得到了一个情绪碰撞模型图。

点击图上任何一个点,就会显示这个人此时此刻的内心感受。

根据碰撞模型图,还可以组合种种研究课题。诸如,女人比男人开心吗?英国人比美国人开心吗? 等等。

结论虽然五花八门,但很靠谱。

比如,幸福感随着年龄的增长而增长。年轻人的幸福往往伴随着刺激;年长的则通常认为平淡是福;女性比男性能感受到更多的爱,但也会感受到更多的愧疚感;男性比女性更容易自我感觉良好,但也觉得更孤独。

统计的乐趣纪录片全集,统计的乐趣纪录片中文版

14.

上述表明,数据没有统计的介入就是一盘散沙。没有意义,什么也不是。

而统计学是按照世间万物的本质规律搭建出异彩纷呈的模型。也许是拆分,也许是重组。

大浪淘沙,沙子变成金子,金子变成沙子。都有可能。

也许,AI就是这么干的。只不过比起真人,它们胜在速度。

总之,打开了统计这扇理性之门,歧路不再,很难被忽悠。

命运从此由自己掌握。

End/图片源自网络