博弈论这门学科由冯诺依曼创立,一直到约翰·纳什,正式成熟了起来。今天人们纪念纳什,很大程度上与博弈论的广为人知有关。 在恋爱中,恋人既是你的合作伙伴,也是你的对手,甚至敌人。所以,要想成为赢家,就要学会与伙伴一样的恋人合作,还要学会与敌人一样的恋人周旋。
什么是博弈论?
中国很早就有博弈论的思想,比如著名的《田忌赛马》。当知道对手的策略之后,就能做出对自己最优的策略。博弈论在生活中广泛应用,比如在伦敦奥运会的羽毛球比赛中。
什么是纳什均衡?
纳什均衡是非合作博弈均衡,假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略,整体策略最优。
在约翰纳什的传记电影《美丽心灵》中就有很好的例子,纳什和他的四个男伙伴在酒吧,而对面正好有五个单身女生,其中一个最为漂亮。如果纳什和他的四个男伙伴都去追求最为漂亮的女神,那么女神就会不知道同意谁而全部拒绝。追求女神不行,接下来追求剩下的四位女生,这四个女生当然也不会同意,因为没人愿意做退而求其次的选择,当备胎。这样就会造成谁也没有搭讪成功。
如果纳什他们改变策略,每个人选择自己的最优策略。那就是,一开始谁都不去追求女神,四位男生去追求其她四位女生,当女神看到其她女神都有人追求,而自己却没有,这时如果纳什去追求女神,到手的几率就会大大增大。在这个策略下,结果每个人都会搭讪成功,从而达到最优。这就是纳什制定的策略。

纳什的博弈论
博弈论在恋爱中怎么体现?
如果有一男一女,他们关系不错,也想成为恋人,但他们都有各自的想法,可能出现如下情况。
男方:主动表白 女方:接受
男方:主动表白 女方:拒绝
男方:没有采取任何行动 女方:也没有任何行动
女方:主动表白 男方:接受
女方:主动表白 男方:拒绝
女方:没有采取任何行动 男方: 也没有任何行动
这时就会出现,表白的一方会被接受和拒绝两种可能,但是如果被拒绝,表白一方就会很痛苦,而且很大可能会破坏双方关系。如果谁都不愿承受这份伤害,那就是保持现状,双方不采取任何行动为最优策略。
但是这样双方就不会成为恋人,怎么打破这一均衡?那就要知道对方的策略是什么。如果知道对方想表白,但又怕拒绝,这时的最优策略就是先去和对方表白,从而得到对方的接受;如果对方没有这个意思,最优策略还是保持现状。
但是如果这个均衡一直保持,那也不是什么好事,因为还有一个因素——时间。随着时间的流失,男方和女方都有了其它策略选择,最终的结局就是谁也得不到对方,从而又变成令人遗憾的结局。
所以“双方都沉默的”策略短时间是最优的,时间长了就不一定了。想要打破这一均衡并不是特别容易,因为人们总不想让自己受伤,想让对方来打破这个均衡,使自己的风险最低,收益最大。
故事还没完,如果男方向女方表白,这就变成了女方知道了男方的决定,怎么选择看要看女方。一般来说可能有两种思想,她们觉得要是轻易的答应呢,怕你不珍惜;要是不答应呢,又怕错过好的。
但是事实上很少有女生发愁这个,因为她们已经知道了男人的决定,会做出“姐很难得到,但是也不是没有这个可能”这个策略与之周旋,又把问题抛回给男生。
以上只是理论分析模型,现实中的男人和女人都会考虑很多因素。正如另外一个段子:
一日,父亲对儿子说:爹给你说个对象吧。儿子回答:不了,我还年轻,得好好工作。父亲说:她是比尔盖茨的女儿。儿子说:这样,行。父亲找到比尔盖茨对盖茨说:我给你找个女婿。盖茨说:不,我女儿还小。父亲说:他是世界银行副总。盖茨听完说:这样,行。父亲找到世界银行董事长对董事长说:我给你找个副总。董事长说:不,我有副总。父亲又说:他是比尔盖茨的女婿。董事长听完说:这样,行……
博弈如何启动?
什么样的情景构成一个博弈?
首先,是一个互动过程。至少有两方参与。
其次,最为关键的是,一方的行为对另一方的行为的收益会产生影响。你如何做,对我如何做有影响。在面对你的不同行为选择时,我就或许有不同的应对策略。
不通人情的经济学家会把人际交往中的很多例子都看成一个博弈。比如谈恋爱,事实上一场理性算计的交易不是爱情,但是如果我们把人类理性变量下交易的那部分提取出来,是可以建模的。
一个博弈从简单到复杂是通过两个纬度进行的。
一个纬度是从静态到动态,简单说,就是一次性买卖,变成你来我往的多次交往。
另一个纬度,是从信息完全变为信息不完全。两个纬度,四个象限,就是博弈论模型不断复杂、不断接近真实世界互动的过程。
大家看下图就一目了然。

1. 静态完全信息博弈
首先,来看单次完全信息的博弈。
最简单的是完全信息下的一次博弈,什么意思?就是咱俩都同时行动,行动结束,游戏结束了。上面所说的简单的囚徒困境就是一次博弈。在这样的情景下,产生的均衡就是纳什均衡。
最简单的情形是只有一个均衡。说白了,就是我知道你的最好策略是什么,你也知道我的最好策略是什么,你知道我知道你的最好策略。反之亦然。
在著名的囚徒困境的例子里,我知道对方肯定会背叛我,因为这样对他最好,那么我也只能背叛,不存在合谋,没有提前商量的空间,各选各的。
也有可能有多个均衡。举个例子,我俩都喜欢吃豆浆搭配油条,牛奶配面包,但是我更喜欢豆浆油条,你更喜欢牛奶面包。你去买油条和面包,我去买牛奶和豆浆,每人各买各的,不沟通,只买一样儿。
这种情况下,无论最终买回来的是豆浆油条,还是牛奶面包,都是均衡。因为,无论是你还是我,单方面都不可能做得比现在更好。这就是均衡的意义。
但是在有些情况下,我们没有绝对占优的策略。
举个足球中射点球的例子。射门的人是射左面还是射右面呢?没有哪个更好,我只希望射门方向与门将扑球的方向相反。而门将所追求的,则是相同。
博弈论学家认为,没有纯策略均衡,只有混合策略均衡。也就是说,我们最终只会以一定的概率去踢左边,一定的概率踢中间,一定的概率踢右边,而门将也会有一定的概率扑左边,一定概率不动,一定的概率扑右边。按照这种概率分布,存在均衡。
证明任何博弈存在这样一个混合策略均衡,就是纳什的贡献。
2. 动态完全信息博弈
按照时间的纬度上往前推一小步,一个单次的博弈会变成一个多次的互动过程。这种拓展有两种情况。
-
一种是重复的博弈。就是说一个博弈重复地进行。很多人知道,在重复的博弈中,囚徒困境就可能得到解决,两个人开始合作了。
有个策略让这种合作成为可能,叫作“一触即发”策略。就是说,你合作我就跟你合作,你要是敢背叛我,我也让你不得好死,大不了一起死。
-
另一种时间的拓展,不是单纯的重复单次博弈,而是一个不断延展的博弈,单次博弈是两个人同时行动,但是在延展博弈中,你先来一下,我再来一下,然后你再来,跟下棋一样。
在这样的博弈里,有简单的纳什均衡,你可以从最终的结果找到符合纳什均衡的解。但是,有些纳什均衡实际上不会产生。你做了什么,决定了我在这一步能做什么。这样的均衡将那些实际上已经被排除掉的真实情况考虑在内了。所以,需要新的均衡概念。
每一次轮到自己走的时候,我们前面已经有别人的行动,已经是事实了。我们就要相机行事。我们所要做的,是去看,在此时此刻,给定之前的行为,我们能做到的最好是什么。也许在上一步做了另一个行为会让我们更好,但是我们没法改变事实。我们能做的,就是看眼下,我能做到的最好。
寻找这样博弈的均衡,就是从最后一步开始,逐步往前推,一直推到开始。因为是完全信息,双方彼此仍然能知道在每一步对方最优的策略是什么。
3. 静态非完全信息博弈
上述是对时间维度上的拓展。那么从简单的一次完全信息博弈变为不完全信息,则是另一种情况。在这种情况下,我们对对方的一些信息是不了解的。比如,它的收益函数,或者说它的偏好。
在这种情况下,我们无法预知对方在给定行为下的最好的策略,那么我们只能赋予对方采取不同策略概率,然后,根据这个概率估计选择自己的策略。
还拿射点球为例子。
对于门将而言,他不知道射门者的偏好,而只是对这个偏好进行一个估计。如果是右撇子,他会估计说这个球员踢向门左侧的策略会大一些。那么,根据这一估计,他会以更大的概率按照这个方向去扑球。但是,射门的人完全有可能踢向另一个方向。
另外一个例子,就是出价买东西。买方喊出一个买价的时候,是不知道卖家心目中的合适价格的,怕喊高了,同样的道理,要是卖价喊价,也有可能喊低了。这样的博弈都是非完全信息的博弈。
事实上,在真实的世界中,大部分博弈是非完全信息的。完全信息下世界是很美好的,非完全信息下,问题就变得复杂。要是我知道姑娘喜欢我,姑娘知道我知道她喜欢我,这世上寻找真爱的效率要提高多少?
4. 非完全信息的动态博弈
把时间上的复杂性和信息不对称都考虑在内,就是博弈论中较为复杂的情况,也是经济学家研究最多的领域。
在信息不对称的情况下,我们会很自然地想到,通过某种方式传递信息。这里假设是我们无法直接告诉对方,或是不想告诉,刻意想迷惑对方。那么,在动态的博弈中,这样的信息传递就是有可能的。
这就是博弈论中最为经典的“信号博弈”(Signaling game),斯宾塞(Michiel Spence)是最早的发明者,1971 年的论文。2001 年跟斯蒂格利茨、耶伦丈夫阿克洛夫获得了诺奖。
博弈双方,一方对另一方的某一特性不了解,不知道它是什么类型,但是呢,我可以通过它发出的信号去推断它的类型。
比如择偶的例子中,一个女孩选择对象,当她无法确认追求者是否真正钟情于她时,她就需要通过追求者发出的信号来判断。因为在证明真爱方面,一句我爱你是没有作用的,需要其他行动。
发出信号是要有成本的,证明真爱,就要发出对你足够的有成本的信号,以凸显出你和别人不一样。在这样的博弈中,均衡是怎样的呢?两种情况。
-
一种是,那些强烈爱的人和那些温和爱的人竞相花费成本证明真爱,最终,停到某一时刻,那些温和爱的人发现,再不值得投入了,这时候爱的足够深的人就胜出了。这叫做“分离均衡”。
-
一种是,到最后,两种人也没完全区分出来,一些爱的不那么深的人也混在真爱中,继续花费成本发送信号对谁都不再值得。姑娘索性选一个人嫁了得了。这叫做“混同均衡”。大家发现,后者,也许往往是现实世界的情况。
在这个经典的博弈基础上,经济学家们又研究,那种发送信号没有成本的均衡情况会是怎样。这个叫做 Cheap Talk。
最近几年不断有诺奖产生的机制设计领域,是在这个领域基础上的拓展。博弈论是给定人们偏好研究人们互动本身,预测结果。机制设计则是倒过来,研究什么样的机制能够保证达成特定的结果,具体而言,在上面的信号博弈中,就是研究如何让人们诚实地汇报自己的真实情况,而非隐瞒。
上面讲了简单博弈变成复杂博弈两个纬度,一个是信息完全变成不完全。一个是从静态单次变成动态多回合。另外,从博弈玩家的人数上也可以从两人变为多人(虽然本质上还是博弈双方),一个非常经典的博弈论模型叫作全局博弈(Global Game)。
Global Game 在政治学和经济学中各有一个很经典的应用。前者比如革命的群体协作,你是否揭竿而起不仅取决于你相信政权有多么脆弱,还同时取决于你相信别人是否参与。在经济学上一个很好的例子是银行挤兑,你是否挤兑取决于你相信别人是否会挤兑,以及你相信银行有多少钱。在这个博弈中,主观的因素变得更加重要,而且往往具有自我预言实现的特点,内涵相当精彩。
总而言之,博弈论是相当强大的思维工具和方*论法**。虽然理论可以很复杂,但其内涵却都在日常生活中,理解起来并不困难。
然而,本是勾心斗角才能在恋爱中获胜的博弈,因为有了相互信任,有了包容和真心,才有了愿得一人心的爱情和执子之手与之偕老的婚姻,或许这才是博弈的真谛。
(本文来源:新浪财经意见领袖专栏机构专栏纽约金融论坛《谈恋爱也要学会纳什的博弈论》,作者王韬及果壳小组)
相关文章精选:(猛戳标题)
新金融评论
聚焦新金融,独家、专业,尽在新金融评论。
中国金融四十人论坛智库体系新金融系列——上海新金融研究院、北方新金融研究院、上海浦山新金融发展基金会,以及上海新金融研究院参与发起的北大互联网金融研究中心,强强联手,打造最专业的新金融平台。
小新欢迎您!长按二维码即可关注。