
正态分布
概率学(Probabilistic)是一门研究随机事件的科学技术,是研究随机现象数量规律的数学分支。随机现象,是相对于决定性现象而言的,所谓决定性现象,就是指在满足一定条件时,必然会出现某一结果的现象。反之在一次实验或观察前,呈现出偶然性结果的现象,我们称之为随机现象。
例如概率学入门经典案例“抛硬币”,满足随机投掷的硬币落在平面静止后既可能正面向上,也可能反面向上,另外还有极小的概率会立起来。硬币质地均匀,抛掷不使用特殊技巧的情况下,出现正面或者反面的概率一定都趋近与50%,这个基本上是大家随时随地都可以做统计的概率实验。起初抛10次你也许能抛出8次反面,2次正面这种看似不遵循概率论的现象,但当你的样本量(Sample size)足够大以后,两种概率终将趋近于50%。
另一个你可能接触到的常见随机事件,是抛掷六面*子骰**。*子骰**如果质地均匀,抛掷不使用特殊技巧,基本上六面出现的概率是相等的,都为1/6。请思考一个问题,如果同时抛掷两个*子骰**,点数之和为7概率是多少?给自己一些时间思考后再继续阅读。

如果你的答案是1/6,那么恭喜你答对了,如果不是瞎蒙的,说明你的概率学学习的不错。两颗*子骰**点数的随机组合总共有6乘以6等于36种情况,其中只有6种组合情况点数之和为7,所以概率是6/36=1/6。并且不难算出,点数和为2的概率和点数和为12的概率相等,均是1/36,点数和为4的概率3/36=1/12。

*子骰**的全部组合
蒙题概率学
在笔者上学的时候,有过将概率学用在野路子的上的经历。研究生英语考试时候,有一个得分率不高的完形填空题型,一共20道题,每一道题4个选项。为了节省时间并蒙中一定量的题目,我选择20道题同时选择选项C的蒙题策略,这里告诫各位学弟学妹千万不要效仿,因为当时的情况是认真做完形填空,即使花了时间,也很难拿到1/4的分数,所以才出此下策,目的是在节省时间的同时,保证稳定的正确率。
但是这一切成立的前提是,真题中20道题目的正确答案分布是平均的,即A、B、C、D选项出现的次数要相同。经过笔者的调查,在2019年的全国英语研究生考试中,完形填空题型的答案正符合这个条件,四个选项各出现了5次。同样的规律也出现在各地的高考真题中,说明考试院的老师们是深知这一情况的,为了防止某些人全部填写相同选项获取高分,完形填空的答案有意均匀分布在四个选项上,全蒙相同选项获取的分数,基本只有平均分的三分之一。最后再次提醒各位不要效仿,最后笔者也因为英语没过线无缘硕士学位。
对于学霸来说,如果能把握这个规律,也许可以在有把握做对19题的前提下,通过分布规律预测自己没把握那题的答案,当然只是理论上可行,实用性欠佳,因为没有人能保证所有考试均符合“答案平均分布”的前提。
既然“全蒙”相同答案大概率只能拿1/4的分数,那如果所有答案都随便选,是否能有更高的分数收益呢?为了验证这个事情,我们使用一段JavaScript程序来模拟蒙题得分:
let ans = [3,3,2,4,1,2,4,3,1,4,1,2,4,3,2,4,1,1,2,3]
let p = 0
let max = -1;
let min = 9999;
for(let j = 0; j < 100; j ++) {
let score = 0
for (var i = ans.length - 1; i >= 0; i--) {
let p = Math.floor((Math.random()*4)+1);
// console.log(p,ans[i])
if(p == ans[i]) {
score ++
}
}
if(score > 10) console.log(score);
if(max < score) max = score
if(min > score) min = score
p = p + score
}
console.log([p,p/100,max,min].join("|"));
代码看不懂没关系,下面是每次模拟100次蒙题的得分情况,我计算了每一次模拟的平均得分,并记录了最高分和最低分。实际测试前十次的结果是分别是:

模拟结果
从结果来看,随机蒙答案,虽然运气好能超过拿到一半的分数,但也有相同的概率拿到超低分,这里涉及到统计学概念“正态分布”,这里不展开来讲,只说结论:期望值是5分,离5分越远,概率越低,理论上蒙对20题的概率是有的,但在实际操作中小到可以忽略。如果有人蒙对了全部20题,可以大概率认为他事先背过答案。我们实验是每一次100轮,即实验了一千次,出现的最佳成绩仅为11,出现的概率也很低,极限值在每次实验出现的频次是1~2次。由于平均分毫无意外地在5分上下波动,考虑到样本量有限(即每个人一生做完形填空的数量远少于实验量),最佳的蒙题策略应该采用同选项策略,虽然不会出高分,但最大概率能保证拿到1/4的分数。
性别的概率
另一个生活中常见的概率问题就是人类生理性别,中学生物告诉我们人类的性染色体有两种常见形态,XX为生理女性,XY为生理男性。受精卵的形成过程中,男女双方各出一条染色体,我们为每一条染色体编号,分别为妈妈的X1和X2,爸爸的X3和Y,则组合的情况则为4种:X1-X3,X2-X3,X1-Y,X2-Y。这四种情况出现的概率是相等的,所以孕育的小孩是男孩还是女孩,概率都是50%。

那么问题来了,社会中很多宣扬能保证生男孩或者生女孩的个人和机构,是否真的可信?答案是否定的,这些人基本都是*子骗**,而且这是一群学过概率学的*子骗**。首先我们确认一下,是否有人为控制孩子性别的科学技术?答案是有,人工受精和试管婴儿技术是支持选择性别的,但允许选择性别有一个前提,就是父母有性别选择性的家族遗传病史。如果不进行细胞级别的外部干预,其他的各种偏方基本上都可以归类到神棍范畴。
往往生活中还有不少人相信这些所谓“大师”的“神药”等产品,愿意花大价钱来搏一搏,这都是不懂概率学造成的后果。因为这一类的*局骗**是零成本的,比如“大师”宣扬说他有神药,一个疗程5,000块人民币,吃一个疗程保证生男孩子,不灵全额退款。如果有10个人为此付了钱,“大师”即使给他们的都是纯净水喝,期望收益也有25,000元,因为每个孩子都有50%的概率是男孩:
期望收益 = 10 * 0.5 * 5000 = 25000
真的是无本万利的买卖,无独有偶,报道说国外有个机构,在某个欧洲足球联赛中,大量发送电子邮件,欺骗消费者说自己的机构有内幕消息,能提前知道每一场比赛的胜负结果。他们用垃圾邮件批量发送软件,一次性发送了32,000封邮件,其中一半预测A队胜利,另一半预测B队胜利。等比赛结束后,再向预测正确的1.6万个用户发送下一场比赛的预测结果,仍然是对半预测结果。这样在连续预测八轮比赛后,他们仍然拥有125位全部预测正确的用户。然后他们向这125位用户售卖决赛的结果,其中有不少人真的会对这个机构感兴趣,并想通过购买的结果在*球赌**中捞一笔。最终有12%的人支付了购买决赛结果的1,500元,一场*局骗**下来,机构净挣22,500元。
当然,学习概率学,并不是为了让我们去做*子骗**,而是为了更好地了解这个世界的真相。学习概率学并不能让我们在*彩博**中挣钱,因为彩票的期望回报是负值,学习概率学只会让我们理智的不购买彩票。要知道,国内双色球的头奖概率是1772万分之一,远低于考上清北的概率(大概万分之五),所以有精力不如在学业上搏一搏。
2018年全国高考考生975万,上清华北大的只有4799人
#随机# #学习# #程序员那些事#