关于博弈论, 你应该知道的事

读《博弈论》有感。

要想在现代社会做一个有文化的人,你必须对博弈论有个大致的了解。 
推荐系数:8.0

博弈论,听起来就是一个非常高级的词汇。最近一次听这个名词还是在公司的高层会议上,几个大老板关于智能驾驶中涉及到的博弈过程非常感兴趣。但那个时候的我对博弈论的概念只停留在一个讲不清楚的“囚徒困境”和《美丽心灵》中的“纳什均衡”。最近读了这本博弈论,总算是把一些基本的常识理论和专用概念给理清楚了,一下子觉得清楚了很多,就在这里和大家一起分享下主要的心得和体会。

博弈论的英文名词叫“Game Theory”,感觉一下子就把博弈论大致是什么给讲清楚了,不得不说有些时候的英文还真的是简洁清晰。这本书总共有十四章:从博弈论入门到纳什均衡,进一步到囚徒困境以及后边的各种各样的博弈场景(枪手博弈、猎鹿博弈、协和博弈等等)系统性地给我们介绍了博弈论的全貌。每一章节都是从该博弈的原始故事讲起,并附带了很多真实案例来讲清楚相关博弈的具体细节和内容,读的过程中甚至觉得是一本很不错的“故事会”。但是由于篇幅有限,我们只会讲讲博弈论的概念和最经典的囚徒困境和纳什均衡,余下的就由读者自己挖掘了。

博弈论是指双方或者多方在竞争、合作、冲突等情况下,充分了解各方信息,在理性假设的前提下,依此选择一种能为本方争取最大利益的最有决策的理论。

博弈论的分类

  1. 合作博弈和非合作博弈。根据博弈的参与者之间是否具有一个有约束力的协议,可以分为合作博弈非合作博弈。合作博弈并不是说参与者有合作的意向,而是说参与者之间有具有约束力的协议,必须在协议范围内进行博弈。一般大家说的博弈都是非合作博弈。
  2.  动态博弈和静态博弈。按照参与者选择策略、做出决定的先后顺序进行划分,如果参与者同时选择或者选择虽然有先后,但是不知道对方的选择策略,那便是静态博弈(石头剪刀布)。如果后者是知道了前者的策略然后决定自己的策略,这属于动态博弈(下象棋)。
  3. 零和博弈、负和博弈和正和博弈。按照博弈结果来看,如果博弈参与者最后得到的收入都小于付出,两败俱伤就是负和博弈(核战争)。如果一方收益一方损失就是零和博弈(赌博、短线炒股)。如果所有人都有收益,那么就是正和博弈(合作共赢)。

囚徒困境

两个盗贼AB被抓,警察分别审讯,对于A来说,如果坦白罪行而B没有坦白,那么A属于立功可以立即释放而B会判处10年。如果B也坦白了罪行,那么两人会各判处6年。假设A没有坦白罪行,那么反之如果B坦白了,A会判处10年。如果B没有坦白,那么两人会各判处1年。

上述描述的场景便是经典的“囚徒困境”,可以用以下的一张图来展示两个囚犯遇到的情况:

B 坦白B 不坦白
A 坦白(6, 6)(0, 10)
A 不坦白(10, 0)(1, 1)

可以看出来,两个人都不坦白是最好的结果。但是由于各自都不知道对方的选择,那么对于单一个体而言选择坦白的结果要么6年要么0年,而选择不坦白的结果是要么10年要么1年。假设对方坦白与否的概率都是50%,那么坦白的坐牢期望是3年而不坦白的期望是5.5年。所以对于一个理性人来讲,都会选择坦白作为自己的最后抉择。

囚徒困境的启示

        个体利益若是追求最大化往往不能得到最大化的集体利益,甚至有时候会得到最差的结局,比如上述的两个囚徒。进一步思考:1. 人际交往的博弈中,单纯的利己主义者并不会总成功,重复博弈次数越多失败的可能性越大;2. 循规蹈矩的合作比单纯的利己主义更能获得成功。

走出囚徒困境

        囚徒困境的前提是两个人要单独隔离审讯,所以打破囚徒困境的最好手段就是合作。博弈者之间的合作最典型的就是欧佩克组织,如果没有该组织协调合作,那么各个石油出口国就会陷入价格的囚徒困境之中。合作将非合作性博弈变成了合作性博弈,合作性博弈主要解决利益分配的问题而不是解决如何让自己利益最大化的问题。一次性博弈中不可能出现合作,所以必须是重复性博弈。例如囚徒困境中不用考虑出狱以后的事情,如果是黑手党的组织,出卖成员的代价则是巨大的,那么并不会出现囚徒困境的问题。

纳什均衡

多人参与博弈中,每个人根据他人的策略制定自己的最优策略。所有人的策略组成一个策略组合,在这个策略组合中,没有人会主动改变自己的策略,因为那样会降低他的收益。只要没有人做出策略调整,任何一个理性的参与者都不会主动地改变自己的策略。这个时候,所有的参与者策略便达到了“纳什均衡”。

研究意义 

        博弈论的概念来自冯诺依曼,但在纳什之前博弈论的范围只限于两人的零和博弈,也就是两个人有输有赢的游戏场景。纳什均衡主要研究多人参与的非零和博弈问题,一下子把博弈论研究的范围从小胡同引入到广阔的天地之中。该观点的提出彻底地改变了人们以往对竞争、市场,以及博弈论的看法,让人们明白了市场竞争中的博弈同博弈均衡的关系。纳什均衡的提出奠定了非合作博弈论发展的基础,此后博弈论的发展主要都是沿着这条线进行。

理解

        有人把纳什均衡比作锅里的多个乒乓球。如果把球放入锅中,它们便会向锅底滚去,然后相互碰撞最后停住不动,这便是达到了均衡,这个时候如果动了其中的一个,其他乒乓球便会受影响,如果要保持这种均衡,就不能动任何一个乒乓球。

美丽心灵

        美丽心灵中有一个很有名的段落,纳什同三个朋友在舞会上,此时进来了5位漂亮的姑娘,其中一位特别出众。对于任何一个人而言,先去邀请最美的姑娘,如果失败再去邀请其余的四个女生将是个人最优的选择。但是纳什指出,如果同时邀请最美的姑娘而掐架,那么最后谁也得不到这个姑娘。等他们退而求其次的时候,另外的姑娘会觉得自己是第二选择从而拒绝他们的邀请。这样一来四个男生各自的最优策略却会导致大家都一无所获。纳什找到了其中的“纳什均衡”,如果每一位都不去邀请最美的姑娘,这样每个人都能有一个舞伴而且不会互相打架。

启示

        亚当斯密的国富论中提到,市场无形的手会自动调节社会经济活动,如果每个人都理性的追求自己的最大收益,那么市场将会发挥最好的效果,社会将会获得最大的收益。这种理论在最早期的小作坊式经济模式下是正确的。但是纳什均衡告诉我们,考虑到经济发展导致经济活动的复杂性,个体利益可能是冲突的,那么最大化社会利益需要在所有个体之间找到一种均衡,在此状态下总体的利益才是最大的。

其他博弈

       除了大家耳熟能详的囚徒困境和纳什均衡以外,博弈论还有很多典型的场景。比如讲大小公司合作的智猪博弈,还有猎鹿博弈、斗鸡博弈、海盗分金博弈等等。里面也会介绍很多熟悉的词语,例如帕累托效率最优(如果要想改善任何参与者的利益都必须损害其他人的利益,那么这个经济已经达到帕累托效率最优)等。其实一开始也说了每个博弈论几乎都是一个带着疑问的寓言故事,所以还是很值得大家自己去翻书读读的。

发表回复

您的电子邮箱地址不会被公开。