利用囚徒困境原理分析OPEC石油价格

美好瞬间 2024-08-10
导读第三章“囚徒困境”的启示  1.“囚徒困境”的深刻哲理在前面的章节,笔者讨论一个“囚徒困境”(Prisoner’sdilemma)变形博弈,很明显,该警察局长所取的策略必然不能够使得两名囚犯坦白罪行。其实,只有改变游..

第三章 “囚徒困境”的启示  

利用囚徒困境原理分析OPEC石油价格

1.“囚徒困境”的深刻哲理

在前面的章节,笔者讨论一个“囚徒困境”(Prisoner’s dilemma)变形博弈,很明显,该警察局长所取的策略必然不能够使得两名囚犯坦白罪行。其实,只有改变游戏规则,利用“囚徒困境”模型策略才可以达到目的。“坦白从宽,抗拒从严”的道理都懂,从博弈论的角度来看,其实就是一个囚徒困境模型的应用。我们前面所讨论的爱情博弈其实也是囚徒困境的一种形式。

这里我们继续前面的讨论,这个警察局局长C如果足够明智的话,必然不要求两名囚犯都招供,而是让两名囚犯中的任何一名坦白,招出另外一个人。这样警察局局长C就要确定,对不坦白的人施以最严厉的刑罚。

这种情况下,警察局局长C对囚犯A和B作成如下许诺:如果他们之中有一人坦白,而另一人不坦白,则坦白者无罪释放,而不坦白者要被判无期徒刑,囚禁终生;如果两人都坦白,则两人都被判有期徒刑5年;如果两人都不坦白,则两人都被判2年监禁。

囚徒困境仍然需要2个前提预设:囚徒A和B两人都是自利理性的个人,即只要给出两种可选的策略,每一方将总是选择其中对他更有利的那种策略;两人无法沟通,要在不知道对方所选结果的情况下,独自进行策略选择。在这种条件下,从囚犯A的立场来看,共有2种可能情况:第一种可能是B取坦白的策略,这时如果囚犯A也坦白,则要入狱5年,如果不坦白,则要囚禁终生,两相比较,结论是应该坦白。第二种可能是囚犯B取沉默的态度,这时若甲也沉默,要入狱2年,如果囚犯A坦白,则可获得自由,两相比较结论是应该坦白。因此,无论囚犯B是坦白还是沉默,囚犯A取坦白的策略对自己更为有利。同样以上推理对于囚犯B也适用。结果两个囚徒都坦白了,都被判刑5年。囚徒困境的“困境”在于如果甲乙二人都保持沉默,则都只被判刑一年,显然比两人都坦白的结果要好。 

两名囚犯都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是惟一的纳什均衡点。除了这个均衡点,A与B的任何一人单方面改变选择,他只会得到更加不经济的结果。而在其它的结果中,比如两人都不坦白的情况下,都有一人可以通过单方面改变选择,来减少自己的刑期。可是两人经过一番理性计算后,却选择了一个使自己陷入不利的结局。

其实“囚徒困境”不允许囚犯A和B进行沟通的设,与实际生活中大部分情况的现实是有差异的。比如,在爱情博弈中,很多恋人会经常花前月下、彻夜厮守;在企业的价格战中,企业之间也会多有沟通,价格;即使是二十世纪下半世纪的美苏军备竞赛中,两个超级大国也会经常进行外交交谈,及时交换信息。

笔者不妨将条件放宽,允许囚犯A和B在审讯室李一起单独呆上10分钟,然后再决定是否坦白。很明显,双方交流的主旨就是建立攻守同盟,克服自利心理,甚至可能订立一个口头协议,要求双方都不去坦白。然后,双方再单独被提审。我们不妨设想,囚犯A的心理,他一定会认为,如果囚犯B遵守约定的话,则自己坦白就可获得自由;如果囚犯B告密的话,若不坦白就会被终生囚禁。事实上,囚犯A的策略并没有因为简单的沟通或协议而摆脱两难境地。

恋人们在恋爱中的海誓山盟,最终还是分手;企业之间相互沟通信誓旦旦,价格战仍然会爆发;美苏两国经常会晤,甚至签订核不扩散条约,但军费一年高过一年。这些现象都反映了上面所说明的问题。

在本节所举的囚徒困境的游戏规则,能够让狡猾的罪犯招供,得到应有的惩罚,固然不是坏事。然而,我们不妨设囚徒A和B都是完全清白的大大的具有理性的良民,这个博弈的纳什均衡并不会因为他们的清白而改变。如果在现实生活中,加上对身体的残害,完全会造成屈打成招的冤错案。在中国历史上,这种事情并不是多么稀有的个案。

在更深刻的意义上,囚徒困境模型动摇了传统社会学、经济学理论基础,这是经济学的重大革命。

传统经济学的鼻祖亚当?斯密在其传世经典《国民财富的性质和原因的研究》中这样描述市场机制:“当个人在追求他自己的私利时,市场的看不见的手会导致最佳经济后果。” 这就是说,每个人的自利行为在“看不见的手”的指引下,追求自身利益最大化的同时也促进了社会公共利益的增长。即自利会带来互利。

传统经济学秉承了亚当?斯密的思想。传统经济学认为:人的经济行为的根本动机是自利,自私是个好东西,每个人都有权追求自己的利益,没有私社会就不会进步,现代社会的财富是建立在对每个人自利权利的保护上的。因此经济学不必担心人们参与竞争的动力,只需关注如何让每个求利者能够自由参与尽可能展开公平竞争的市场机制。只要市场机制公正,自然会增进社会。

但是囚徒困境的结果,恰恰表明个人理性不能通过市场导致社会的最优。每一个参与者可以相信市场所提供的一切条件,但无法确信其他参与者是否能与自己一样遵守市场规则。

佛家讲因果律,儒家讲究“财自道生,利缘义取”。从囚徒困境看来,如果一味地想算计别人,算来算去,最后算计到自己头上来了。如果我们将囚徒困境中的有期徒刑改为,那么“机关算尽太聪明,反误了卿卿性命”用在这里是再恰当不过的了。

博弈论是什么

囚犯的两难处境

大理论中的小故事

要了解纳什的贡献,首先要知道什么是非合作博弈问题。现在几乎所有的博弈论教科书上都会讲“囚犯的两难处境”的例子,每本书上的例子都大同小异。

博弈论毕竟是数学,更确切地说是运筹学的一个分支,谈经论道自然少不了数学语言,外行人看来只是一大堆数学公式。好在博弈论关心的是日常经济生活问题,所以不能不食人间烟火。其实这一理论是从棋弈、和战争等带有竞赛、对抗和决策性质的问题中借用的术语,听上去有点玄奥,实际上却具有重要现实意义。博弈论大师看经济社会问题犹如棋局,常常寓深刻道理于游戏之中。所以,多从我们的日常生活中的凡人小事入手,以我们身边的故事做例子,娓娓道来,并不乏味。话说有一天,一位富翁在家中被杀,财物被盗。警方在此案的侦破过程中,抓到两个犯罪嫌疑人,斯卡尔菲丝和那库尔斯,并从他们的住处搜出被害人家中丢失的财物。但是,他们矢口否认曾杀过人,辩称是先发现富翁被杀,然后只是顺手牵羊偷了点儿东西。于是警方将两人隔离,分别关在不同的房间进行审讯。由地方检察官分别和每个人单独谈话。检察官说,“由于你们的偷盗罪已有确凿的证据,所以可以判你们一年刑期。但是,我可以和你做个交易。如果你单独坦白的罪行,我只判你三个月的监禁,但你的同伙要被判十年刑。如果你拒不坦白,而被同伙检举,那么你就将被判十年刑,他只判三个月的监禁。但是,如果你们两人都坦白交代,那么,你们都要被判5年刑。”斯卡尔菲丝和那库尔斯该怎么办呢?他们面临着两难的选择——坦白或抵赖。显然最好的策略是双方都抵赖,结果是大家都只被判一年。但是由于两人处于隔离的情况下无法串供。所以,按照亚当?斯密的理论,每一个人都是从利己的目的出发,他们选择坦白交代是最佳策略。因为坦白交代可以期望得到很短的监禁———3个月,但前提是同伙抵赖,显然要比自己抵赖要坐10年牢好。这种策略是损人利己的策略。不仅如此,坦白还有更多的好处。如果对方坦白了而自己抵赖了,那自己就得坐10年牢。太不划算了!因此,在这种情况下还是应该选择坦白交代,即使两人同时坦白,至多也只判5年,总比被判10年好吧。所以,两人合理的选择是坦白,原本对双方都有利的策略(抵赖)和结局(被判1年刑)就不会出现。这样两人都选择坦白的策略以及因此被判5年的结局被称为“纳什均衡”,也叫非合作均衡。因为,每一方在选择策略时都没有“共谋”(串供),他们只是选择对自己最有利的策略,而不考虑社会或任何其他对手的利益。也就是说,这种策略组合由所有局中人(也称当事人、参与者)的最佳策略组合构成。没有人会主动改变自己的策略以便使自己获得更大利益。“囚徒的两难选择”有着广泛而深刻的意义。个人理性与集体理性的冲突,各人追求利己行为而导致的最终结局是一个“纳什均衡”,也是对所有人都不利的结局。他们两人都是在坦白与抵赖策略上首先想到自己,这样他们必然要服长的刑期。只有当他们都首先替对方着想时,或者相互合谋(串供)时,才可以得到最短时间的监禁的结果。“纳什均衡”首先对亚当?斯密的“看不见的手”的原理提出挑战。按照斯密的理论,在市场经济中,每一个人都从利己的目的出发,而最终全社会达到利他的效果。不妨让我们重温一下这位经济学圣人在《国富论》中的名言:“通过追求(个人的)自身利益,他常常会比其实际上想做的那样更有效地促进社会利益。”从“纳什均衡”我们引出了“看不见的手”的原理的一个悖论:从利己目的出发,结果损人不利己,既不利己也不利他。两个囚徒的命运就是如此。从这个意义上说,“纳什均衡”提出的悖论实际上动摇了西方经济学的基石。因此,从“纳什均衡”中我们还可以悟出一条真理:合作是有利的“利己策略”。但它必须符合以下黄金律:按照你愿意别人对你的方式来对别人,但只有他们也按同样方式行事才行。也就是中国人说的“己所不欲勿施于人”。但前提是人所不欲勿施于我。其次,“纳什均衡”是一种非合作博弈均衡,在现实中非合作的情况要比合作情况普遍。所以“纳什均衡”是对冯?诺依曼和摩根斯特恩的合作博弈理论的重展,甚至可以说是一场革命。

搜索:博弈论与纳什平衡

博弈论(game theory)对人的基本定是:人是理性的(rational,或者说自私的),理性的人是指他在具体策略选择时的目的是使自己的利益最大化,博弈论研究的是理性的人之间如何进行策略选择的。

纳什(John Nash)编制的博弈论经典故事"囚徒的困境",说明了非合作博弈及其均衡解的成立,故称"纳什平衡"。

所有的博弈问题都会遇到三个要素。在囚徒的故事中,两个囚徒是当事人(players)又称参与者;当事人所做的选择策略 (strategies)是承认了事实,最后两个人均赢得(payoffs)了中间的宣判结果。如果两个囚徒之中有一个承认,另外一个抵赖,不承认,那么承认者将会得到减刑处理,而抵赖者将会得到最严厉的判决,在纳什故事中两个人都承认了犯罪事实,所以两个囚徒得到的是中间的结果。

类似的: 我们也能从“自私的基因”等理论中看到“纳什平衡”的体现。

在互联网这个原始丛林中:最优策略是如何产生的呢?

一、 博弈中最优策略的产生

艾克斯罗德(Robert Axelrod)在开始研究合作之前,设定了两个前提:一、每个人都是自私的;二、没有权威干预个人决策。也就是说,个人可以完全按照自己利益最大化的企图进行决策。在此前提下,合作要研究的问题是:第一、人为什么要合作;第二、人什么时候是合作的,什么时候又是不合作的;第三、如何使别人与你合作。

社会实践中有很多合作的问题。比如国家之间的关税报复,对他国产品提高关税有利于保护本国的经济,但是国家之间互提关税,产品价格就提高了,丧失了竞争力,损害了国际贸易的互补优势。在对策中,由于双方各自追求自己利益的最大化,导致了群体利益的损害。对策论以著名的囚犯困境来描述这个问题。

A和B各表示一个人,他们的选择是完全无差异的。选择C代表合作,选择D代表不合作。如果AB都选择C合作,则两人各得3分;如果一方选C,一方选D,则选C的得零分,选D的得5分;如果AB都选D,双方各得1分。

显然,对群体来说最好的结果是双方都选C,各得3分,共得6分。如果一方选C,一方选D,总体得5分。如果两人都选D,总体得2分。

对策学界用这个矩阵来描述个体理性与群体理性的冲突:每个人在追求个体利益最大化时,就使群体利益受损,这就是囚徒困境。在矩阵中,对于A来说,当对方选C,他选D得5分,选C只得3分;当对方选D,他选D得1分,选C得零分。因此,无论对方选C或D,对A来说,选D都得分最多。这是A单方面的优超策略。而当两个优超策略相遇,即A,B都选D时,结果是各得1分。这个结果在矩阵中并非最优。困境就在于,每个人取各自的优超策略时,得出的解是稳定的,但不是帕累托最优的,这个结果体现了个体理性与群体理性的矛盾。在数学上,这个一次性决策的矩阵没有最优解。

如弈进行多次,只要对策者知道博弈次数,他们在最后一次肯定取互相背叛的策略。既然如此,前面的每一次也就没有合作的必要,因此,在次数已知的多次博弈中,对策者没有一次会合作。

如弈在多人间进行,而且次数未知,对策者就会意识到,当持续地取合作并达成默契时,对策者就能持续地各得3分,但如果持续地不合作的话,每个人就永远得1分。这样,合作的动机就显现出来。多次对局下,未来的收益应比现在的收益多一个折现率W,W越大,表示未来的收益越重要。在多人对策持续进行下去,且W比较大,即未来充分重要时,最优的策略是与别人取的策略有关的。设某人的策略是,第一次合作,以后只要对方不合作一次,他就永不合作。对这种对策者,当然合作下去是上策。如有的人不管对方取什么策略,他总是合作,那么总是对他取不合作的策略得分最多。对于总是不合作的人,也只能取不合作的策略。

艾克斯罗德做了一个实验,邀请多人来参加游戏,得分规则与前面的矩阵相同,什么时候结束游戏是未知的。他要求每个参赛者把追求得分最多的策略写成计算机程序,然后用单循环赛的方式将参赛程序两两博弈,以找出什么样的策略得分最高。

第一轮游戏有14个程序参加,再加上艾克斯罗德自己的一个随机程序(即以50%的概率选取合作或不合作),运转了300次。结果得分最高的程序是加拿大学者罗伯布写的"一报还一报"(tit for tat)。这个程序的特点是,第一次对局用合作的策略,以后每一步都跟随对方上一步的策略,你上一次合作,我这一次就合作,你上一次不合作,我这一次就不合作。艾克斯罗德还发现,得分排在前面的程序有三个特点:第一,从不首先背叛,即"善良的";第二,对于对方的背叛行为一定要报复,不能总是合作,即" 可激怒的";第三,不能人家一次背叛,你就没完没了的报复,以后人家只要改为合作,你也要合作,即"宽容性"。

为了进一步验证上述结论,艾氏决定邀请更多的人再做一次游戏,并把第一次的结果公开发表。第二次征集到了62个程序,加上他自己的随机程序,又进行了一次竞赛。结果,第一名的仍是"一报还一报"。艾氏总结这次游戏的结论是:第一,"一报还一报"仍是最优策略。第二,前面提到的三个特点仍然有效,因为63人中的前15名里,只有第8名的哈灵顿程序是"不善良的",后15名中,只有1个总是合作的是"善良的"。可激怒性和宽容性也得到了证明。此外,好的策略还必须具有的一个特点是"清晰性",能让对方在三、五步对局内辨识出来,太复杂的对策不见得好。"一报还一报"就有很好的清晰性,让对方很快发现规律,从而不得不取合作的态度。

二、 合作的进行过程及规律

"一报还一报"的策略在静态的群体中得到了很好的分数,那么,在一个动态的进化的群体中,这种合作者能否产生、发展、生存下去呢?群体是会向合作的方向进化,还是向不合作的方向进化?如果大家开始都不合作,能否在进化过程中产生合作?为了回答这些疑问,艾氏用生态学的原理来分析合作的进化过程。

设对策者所组成的策略群体是一代一代进化下去的,进化的规则包括:一,试错。人们在对待周围环境时,起初不知道该怎么做,于是就试试这个,试试那个,哪个结果好就照哪个去做。第二,遗传。一个人如果合作性好,他的后代的合作基因就多。第三,学习。比赛过程就是对策者相互学习的过程,"一报还一报"的策略好,有的人就愿意学。按这样的思路,艾氏设计了一个实验,设63个对策者中,谁在第一轮中的得分高,他在第二轮的群体中所占比例就越高,而且是他的得分的正函数。这样,群体的结构就会在进化过程中改变,由此可以看出群体是向什么方向进化的。

实验结果很有趣。"一报还一报"原来在群体中占1/63,经过1000代的进化,结构稳定下来时,它占了24%。另外,有一些程序在进化过程中消失了。其中有一个值得研究的程序,即原来前15名中唯一的那个"不善良的"哈灵顿程序,它的对策方案是,首先合作,当发现对方一直在合作,它就突然来个不合作,如果对方立刻报复它,它就恢复合作,如果对方仍然合作,它就继续背叛。这个程序一开始发展很快,但等到除了"一报还一报"之外的其它程序开始消失时,它就开始下降了。因此,以合作系数来测量,群体是越来越合作的。

进化实验揭示了一个哲理:一个策略的成功应该以对方的成功为基础。"一报还一报"在两个人对策时,得分不可能超过对方,最多打个平手,但它的总分最高。它赖以生存的基础是很牢固的,因为它让对方得到了高分。哈灵顿程序就不是这样,它得到高分时,对方必然得到低分。它的成功是建立在别人失败的基础上的,而失败者总是要被淘汰的,当失败者被淘汰之后,这个好占别人便宜的成功者也要被淘汰。

那么,在一个极端自私者所组成的不合作者的群体中,"一报还一报"能否生存呢?艾氏发现,在得分矩阵和未来的折现系数一定的情况下,可以算出,只要群体的 5%或更多成员是"一报还一报"的,这些合作者就能生存,而且,只要他们的得分超过群体的总平均分,这个合作的群体就会越来越大,最后蔓延到整个群体。反之,无论不合作者在一个合作者占多数的群体中有多大比例,不合作者都是不可能自下而上的。这就说明,社会向合作进化的棘轮是不可逆转的,群体的合作性越来越大。艾克斯罗德正是以这样一个鼓舞人心的结论,突破了"囚犯困境"的研究困境。

在研究中发现,合作的必要条件是:第一、关系要持续,一次性的或有限次的博弈中,对策者是没有合作动机的;第二、对对方的行为要做出回报,一个永远合作的对策者是不会有人跟他合作的。

那么,如何提高合作性呢?首先,要建立持久的关系,即使是爱情也需要建立婚姻契约以维持双方的合作。(火车站的小贩为什么要骗人?为什么工作中要形成小组制度?换防的时候一方总是要小小地进攻一下的,在中越前线就是这样)第二、要增强识别对方行动的能力,如果不清楚对方是合作还是不合作,就没法回报他了。第三、要维持声誉,说要报复就一定要做到,人家才知道你是不好欺负的,才不敢不与你合作。第四、能够分步完成的对局不要一次完成,以维持长久关系,比如,贸易、谈判都要分步进行,以促使对方取合作态度。第五、不要嫉妒人家的成功,"一报还一报"正是这样的典范。第六、不要首先背叛,以免担上罪魁祸首的道德压力。第七、不仅对背叛要回报,对合作也要作出回报。第八、不要耍小聪明,占人家便宜。

(打桥牌和打的区别)

艾克斯罗德在《合作的进化》一书结尾提出几个结论。第一、友谊不是合作的必要条件,即使是敌人,只要满足了关系持续,互相回报的条件,也有可能合作。比如,第一次世界大战期间,德英两军在战壕战中遇上了三个月的雨季,双方在这三个月中达成了默契,互相不攻击对方的粮车给养,到大反攻时再你死我活地打。这个例子说明,友谊不是合作的前提。第二、预见性也不是合作的前提,艾氏举出生物界低等动物、植物之间合作的例子来说明这一点。但是,当有预见性的人类了解了合作的规律之后,合作进化的过程就会加快。这时,预见性是有用的,学习也是有用的。

当游戏中考虑到随机干扰,即对策者由于误会而开始互相背叛的情形时,吴坚忠博士经研究发现,以修正的"一报还一报",即以一定的概率不报复对方的背叛,和 "悔过的一报还一报",即以一定的概率主动停止背叛。群体所有成员处理随机环境的能力越强,"悔过的一报还一报"效果越好,"宽大的一报还一报"效果越差。

三、 艾克斯罗德的贡献与局限性

艾克斯罗德通过数学化和计算机化的方法研究如何突破囚徒困境,达成合作,将这项研究带到了一个全新境界,他在数学上的证明无疑是十分雄辩和令人信服的,而且,他在计算机模拟中得出的一些结论是非常惊人的发现,比如,总分最高的人在每次博弈中都没有拿到最高分。(刘邦和项羽的战争)

艾氏所发现的"一报还一报"策略,从社会学的角度可以看作是一种"互惠式利他",这种行为的动机是个人私利,但它的结果是双方获利,并通过互惠式利他有可能覆盖了范围最广的社会生活,人们通过送礼及回报,形成了一种社会生活的秩序,这种秩序即使在多年隔绝,语言不通的人群之间也是最易理解的东西。比如,哥伦布登上美洲大陆时,与印地安人最初的交往就开始于互赠礼物。有些看似纯粹的利他行为,比如无偿损赠,也通过某些间接方式,比如社会声誉的获得,得到了回报。研究这种行为,将对我们理解社会生活有很重要的意义。

囚徒困境扩展为多人博弈时,就体现了一个更广泛的问题——"社会悖论",或"悖论"。人类共有的是有限的,当每个人都试图从有限的中多拿一点儿时,就产生了局部利益与整体利益的冲突。人口问题、危机、交通阻塞,都可以在社会悖论中得以解释,在这些问题中,关键是通过研究,制定游戏规则来控制每个人的行为。

艾克斯罗德的一些结论在中国古典文化道德传统中可以很容易地找到对应,"投桃报李"、"人不犯我,我不"都体现了"tit for tat"的思想。但这些东西并不是最优的,因为"一报还一报"在充满了随机性的现实社会生活里是有缺陷的。对此,孔子在几千年前就说出了"以德报德,以直报怨"这样精彩的修正策略,所谓"直",就是公正,以公正来回报对方的背叛,是一种修正了的"一报还一报",修正的是报复的程度,本来会让你损失5分,现在只让你损失3分,从而以一种公正审判来结束代代相续的报复,形成文明。

但是,艾氏对博弈者的一些设和结论使其研究不可避免地与现实脱节。首先,《合作的进化》一书暗含着一个重要的定,即,个体之间的博弈是完全无差异的。现实的博弈中,对策者之间绝对的平等是不可能达到的。一方面,对策者在实际的实力上有差异,双方互相背叛时,可能不是各得1分,而是强者得5分,弱者得0 分,这样,弱者的报复就毫无意义。另一方面,即使对局双方确实旗鼓相当,但某一方可能怀有赌徒心理,认定自己更强大,取背叛的策略能占便宜。艾氏的得分矩阵忽视了这种情形,而这种赌徒心理恰恰在社会上大量引发了零和博弈。因此,程序还可以在此基础上进一步改进。

其次,艾氏认为合作不需预期和信任。这是他受到质疑颇多之处。对策者根据对方前面的战术来制定自己下面的战术,合作要求个体能够识别那些曾经相遇过的个体并且记得与其相互作用的历史,以便作出反应,这些都暗含着"预期"行为。在应付复杂的对策环境时,信任可能是对局双方达成合作的必不可少的环节。但是,预期与信任如何在计算机的程序中体现出来,仍是需要研究的。

最后,重复博弈在现实中是很难完全实现的。一次性博弈的大量存在,引发了很多不合作的行为,而且,对策的一方在遭到对方背叛之后,往往没有机会也没有还手之力去进行报复。比如,资本积累阶段的违约行为,国家之间的核威慑。在这些情况下,社会要使交易能够进行,并且防止不合作行为,必须通过法制手段,以法律的惩罚代替个人之间的"一报还一报",规范社会行为。这是艾克斯罗德的研究对制度学派的一个重要启发。

什么是“博弈”

一,博弈总论

博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,从各自选择的行为或是策略进行选择并加以实施,并从各自取得相应结果或收益的过程,在经济学上博奕论是个非常重要的理论概念。

什么是博弈论?古语有云,世事如棋。生活中每个人如同棋手,其每一个行为如同在一张看不见的棋盘上布一个子,精明慎重的棋手们相互揣摩、相互牵制,争赢,下出诸多精彩纷呈、变化多端的棋局。博弈论是研究棋手们 “出棋” 着数中理性化、逻辑化的部分,并将其系统化为一门科学。换句话说,就是研究个体如何在错综复杂的相互影响中得出最合理的策略。事实上,博弈论正是衍生于古老的游戏或曰博弈如象棋、等。数学家们将具体的问题抽象化,通过建立自完备的逻辑框架、体系研究其规律及变化。这可不是件容易的事情,以最简单的二人对弈为例,稍想一下便知此中大有玄妙:若设双方都精确地记得自己和对手的每一步棋且都是最“理性” 的棋手,甲出子的时候,为了赢棋,得仔细考虑乙的想法,而乙出子时也得考虑甲的想法,所以甲还得想到乙在想他的想法,乙当然也知道甲想到了他在想甲的想法…

面对如许重重迷雾,博弈论怎样着手分析解决问题,怎样对作为现实归纳的抽象数学问题求出最优解、从而为在理论上指导实践提供可能性呢?现代博弈理论由匈牙利大数学家冯·诺伊曼于20世纪20年代开始创立,1944年他与经济学家奥斯卡·摩根斯特恩合作出版的巨著《博弈论与经济行为》,标志着现代系统博弈理论的初步形成。对于非合作、纯竞争型博弈,诺伊曼所解决的只有二人零和博弈--好比两个人下棋、或是打乒乓球,一个人赢一着则另一个人必输一着,净获利为零。在这里抽象化后的博弈问题是,已知参与者集合(两方) ,策略集合(所有棋着) ,和盈利集合(赢子输子) ,能否且如何找到一个理论上的“解” 或“平衡” ,也就是对参与双方来说都最“合理” 、最优的具体策略?怎样才是“合理” ?应用传统决定论中的“最小最大” 准则,即博弈的每一方都设对方的所有功略的根本目的是使自己最大程度地失利,并据此最优化自己的对策,诺伊曼从数学上证明,通过一定的线性运算,对於每一个二人零和博弈,都能够找到一个“最小最大解” 。通过一定的线性运算,竞争双方以概率分布的形式随机使用某套最优策略中的各个步骤,就可以最终达到彼此盈利最大且相当。当然,其隐含的意义在於,这套最优策略并不依赖于对手在博弈中的操作。用通俗的话说,这个著名的最小最大定理所体现的基本“理性” 思想是“抱最好的希望,做最坏的打算” 。

虽然二人零和博弈的解决具有重大的意义,但作为一个理论来说,它应用于实践的范围是极其有限的。不提耽于游戏的玩家,可以说除了军事竞争,几乎难再有用武之地。二人零和博弈主要的局限性有二,一是在各种社会活动中,常常有多方参与而不是只有两方;二是参与各方相互作用的结果并不一定有人得利就有人失利,整个群体可能具有大於零或小于零的净获利。对於后者,让我们来看一个历史上最经典的有趣个例: “囚徒困境” 。话说警方抓到两个盗窃犯,惜证据尚不足,遂寄希望于嫌犯自己招供。警方把两个隔离起来,分别审问,交代政策如下:坦白从宽,抗拒从严!如果你招了,另一个人没招,那么就将你释放,另一人判20年;同样如果你不招,另一个人招了,那么你得被判20年,另一个人被释放。如果两个人都招,警方证据就足了,两人都判10年。至於两个人都不招的情况,不用警方交代,两个人都得判,但因证据不力,判得都要轻许多,比如1年。警方最后说,那边还有个警察,对你的同伙交代一模一样的政策呢。罪犯心里打起小九九,如果对方招了,我招是10年,不招是20年,是招划算;如果对方不招,我招是无罪释放,不招是1年,还是招划算。於是乎,招!两个“精明” 的小偷都招了,都被判了10年,正中警方下怀。聪明的读者,其实如果两个小偷都不招,就会被各判1年,对他们来说岂不更好?在这个囚徒困境问题中,参与者仍是两名(两个盗窃犯) ,但这不再是一个零和的博弈,人受损并不等於我收益。两个小偷可能一共被判20年,或一共只被判2年。

对於多人参与、非零和的博弈问题,在纳什之前,无人知道如何求解,或者说怎样找到类似于最小最大解那样的“平衡” 。而找不到解,下面的研究当然无法进行,更谈不上指导实践了。纳什对博弈论的巨大贡献,正在於他天才性地提出了“纳什均衡” 的基本概念,为更加普遍广泛的博弈问题找到了解。纳什均衡的基本思想是,在这个解集中所有参与者的策略都是对其他参与者所用策略的最佳对策,没有人能够通过单单改变自己的策略提高收益。以前面的囚徒困境为例,如果小偷甲相信小偷乙招供,那么他的最佳策略是招供,而如果小偷乙相信小偷甲招供,那么他的最佳策略仍是招供。这就是一个纳什均衡,它是“自确定” 的。在囚徒困境中,只存在一个纳什均衡。但若将条件改变一下,在许多其它的具体问题中,纳什均衡可能不止一个。纳什巧妙地运用数学技巧,证明了如下纳什定理:对於任何一个n人参与,非合作博弈(零和或非零和) ,如果每个参与者都只有有限条策略,那么一定存在至少一个纳什均衡解集。象许多科学上最杰出的思想一样,这一概念以极简洁明了的方式解决了悬而未解的难题。看似简单,似乎属於那种“本来我也能想到” 的东西,然而那时除了纳什,一代宗师诺伊曼也没有想到。纳什均衡的提出,对博弈论的发展产生了革命性的影响,纳什均衡的概念已成为现代博弈论的基石和中心(虽然在少数博弈理论家中此点仍有争议) 。纳什的好友,普林斯顿大学经济学教授迪克西特曾说,“如果每次有人说起或写下纳什均衡这几个字,纳什都能拿到一块钱的话,那么他现在会是个大富翁了!”

上面提到的博弈理论试图解决的都是非合作型问题,也就是参与者之间除了决策结果相互影响,没有其它形式的信息交流。通过囚徒困境一例可以看出,如果参与者两个小偷之间能够彼此商议,他们做出的策略决定会截然不同(当然是两人一起抵赖划算) 。诚然,在各种生活行为中,人与人之间除了竞争关系,还存在合作关系,常常是两种关系并存,合理的合作能够给双方带来共同利益。这是合作型博弈论研究的范畴。诺伊曼在《博弈论与经济行为》一书中建立了合作型博弈论的基本模型,但是对於其中及其重要的双向协商问题(即参与者如何“讨价还价”) ,没有能给出一个确定的解。纳什对这一领域同样做出了卓越贡献,他不仅提出了讨价还价问题的公理化解法,直接裨益劳动经济和国际贸易,还在理论上利用这个解法良好的预测性进一步提出纳什方案:将合作型博弈中的协商转化为一个更广泛的非合作型博弈的一个步骤--协商的目的最终仍是最大化自己的利益。此外,在测试博弈论的行为实验学上,纳什也是一名先驱。他曾展开讨价还价和联盟形成的实验,并曾敏锐地指出,在其他实验者的囚徒困境实验里,反复让一对参与者重复实验实际上将单步策略问题转化成了一个大的多步策略问题。而后一思想初次提示了后来发展起来的在经济和政治领域起重要作用的重复博弈理论中缄默共谋的可能性。

这些也许看起来略显枯燥的理论,以逻辑推理为工具对人们日常生活中的竞争和合作行为进行严谨有序的数学归纳,当数学家们孜孜不倦地将直觉上升为科学,再反作用于生活时,其影响之深远难以尽述。今天,纳什为之做出基础性贡献的现代博弈理论经过许多专家的不断发展,不仅自身理论体系日臻成熟和完善,而且被广泛应用于经济学、政治学、军事学甚至生物学等各个领域。在生物学领域,博弈论被用于研究种族遗传学和进化生物学中种间和种内的竞争,以及单个基因之间的竞争,并反过来推动博弈论的思想发展。在政治、军事学领域,博弈论被用于分析选举策略、战争起因、立法议程安排等等重大事宜。在经济学领域,博弈论更是已经融入整个学科的主流,经济学教材和杂志无不收入博弈论的内容,经济学家们已经把研究策略相互作用的博弈论当作最合适的分析工具分析各类经济问题,诸如公共经济、国际贸易、自然经济、工业管理等等,等等。就博弈论应用于经济学的直接效益,举个实例,如《美丽心灵》一书中提到,1994年美国向商家拍卖大部份电磁波谱。这一多回合拍卖由一批博弈论专家本着最大化收益和各商家的利用率原则精心设计,取得极大的成功。获得超过一百亿美元的收入,各频率的波谱也都找到了满意的归宿。与此相对映的是,新西兰一个类似却没有经过博弈理论设计的拍卖会惨遭失败。只获得预计收入的15%,而被拍卖的频率也未能物尽其用。譬如因为无人竞争,一个大学生只花1美元就买到了一个电视台许可证!正因为博弈论对现代经济学具有如此重大的冲击和影响,1994年瑞典学院宣布该年全世界科学家的最高荣誉诺贝尔奖之经济学奖颁发给包括纳什在内的三位数学家,以表彰他们对非合作型博弈论的开拓性分析。

二, 以下的六段是关于纳什的介绍

世界终于因为博弈论而承认了纳什的天才,这一年,他已是66岁的老人。与其在科学上令人眩目的杰出贡献相比,他用几十年漫长的岁月书写的充满才华和、充满磨难和苦痛、交织理性和疯狂的人生,竟也毫不逊色,教人无限感慨和敬仰。纳什出生于1928年一个电子工程师家庭,少年时代一方面性格孤僻,一方面显示出非凡的数学才能。17岁进入今卡耐基梅隆大学时原专业是化学工程,但是在慧眼识珠的老师的建议下,转行专攻数学。在此期间他选修了一门国际经济学课程,从而引发了对经济学命题的兴趣,后来发表的关于合作型博弈讨价还价问题的论文就是源于这时的一些想法。20岁时纳什在卡耐基拿到数学学士和硕士学位,接受了普林斯顿大学优裕的奖学金,成为这里的一名研究生。他对许多数学学科都表现出兴趣,如拓扑学、代数学、几何学、博弈论和逻辑学等。着手准备博士论文时,他决心独创一个属於自己的崭新课题。最终过去曾思考的讨价还价问题引导他建立非合作型博弈论的基本原理。1949年,21岁的纳什写下一篇著名的论文《多人博弈的均衡点》,提出了纳什均衡的概念和解法、整个现代非合作型博弈论中最重要的思想之一,也奠定了44年后他获得诺贝尔奖的基础。1950年纳什曾带着他的想法去会见当时名满天下的诺伊曼,遭到断然否定,但是在普林斯顿大学宽松的科学环境下,他的论文仍然得到发表并引起了轰动。同年他以论文《非合作型博弈》获得数学博士学位。

以纯数学家自居的纳什,毕业后在兰德研究所和普林斯顿大学工作期间,证明了一个反直觉的等距嵌入定理,并引入全新的方法证明困难得多的高维等距嵌入定理,强有力地推动了对偏微分方程存在性、唯一性和连续性定理的证明。对於纯数学家来说,数学是精神的艺术体操,评判一项研究的优劣,标准在於其数学深度及是否引入了数学新思想、新方法,或是解决了长期悬而未解的难题。从这一角度,纳什的这一成果,以及数年后于麻省理工学院工作时的更加艰深的数学研究,比他的纳什均衡还要让数学同行们信服。确实,1958年纳什因其在数学领域的优异工作被美国《财富》杂志评为新一代天才数学家中最杰出的人物。然而,天有不测风云,人有旦夕祸福,就在纳什春风得意、事业就要达到顶峰时,却突然遭受命运无情的重重一撞,从云端坠下地狱。纳什在他的而立之年患上了精神分裂症。

他不是一个完美的人,早在1952年,纳什懈逅了一位大他5岁的姑娘,与之交往,次年有了个私生子,此后仍一直与她保持若即若离的关系。1956年他的父母发现了儿子的风流韵事,不久后他的父亲就去世了,不知是否与此打击有关,也不知纳什是否曾为此自责。1957年他与麻省理工学院年轻美丽的女学生爱莉西娅结婚,此后四十多年患难与共的爱情和亲情可以见证,这或许是他的个人生活中最完美、最的一刻。1958年爱莉西娅身怀有孕,尚未分娩,纳什的精神状况就开始恶化。他的举止越来越古怪,一步步走向心智狂乱。

纳什所患的是妄想型精神分裂症,所有精神疾病中最可怕的一种。病人被时断时续不切实际的疯狂念头充斥头脑,并且会产生幻视、幻听,同自己想出来的人交谈。纳什会着对空气说,某份报纸里藏有来自另一个星球的只有他能破解的信息;会突然辞去在麻省的职位,只身跑到欧洲,要放弃美国国籍,还是爱莉西娅跟去把他拖回来;在家中,他不断地威胁着妻子爱莉西娅。万般无奈之下,爱莉西娅于1962年和纳什离婚。但是她对他的忠诚爱情并没有就此消失。70年纳什的母亲去世,而他的姐姐无法负担他,就在纳什孤苦无依、就要流落街头的时候,善良的爱莉西娅接他来与自己同住。她不仅在起居上关心他,而且以女性特有的细心敏感照料着他的心情。她体贴他不肯去医院封闭治疗的愿望,并把家搬到远离喧嚣的普林斯顿,希望宁静熟悉的学术氛围有助于稳定纳什的情绪。

这是一场奇特的博弈。纳什,这个研究理性策略的数学天才,猝然间失去了赖以自傲的理性思维,身不由己地在清醒和疯狂之间来回挣扎徘徊,是永远坠向深渊还是走回家园?在那个无人能解的世界里,他始终没有放弃的对数学的热爱。我们无法知道纳什所承受的所有痛苦,但是足可以揣摩意愿和能力之间的巨大冲突是怎样漫长的精神灾难。的是,在这场博弈里,还有一个忠贞不渝的参与者,当他喃喃自语说着谁也听不懂的话时,当他象幽灵似的逡巡于绿色校园时,总是一双温存的眼睛和手臂勇敢地陪伴着他。世上最坚强的两样东西,意志和爱情,结合在一起,创造出一个最优策略,那就是 - 奇迹。是的,世界目睹了这场博弈的喜剧性结局,在纳什罹患精神分裂症三十余年后的九十年代,他的精神逐渐恢复了正常。1994年纳什博士在为诺贝尔奖撰写的自传中没有提及精神疾病给他带来的痛苦,倒是说精神失常使他摆脱了常轨思维的束缚,可以帮助他创造全新的理论。结尾处他写道,“从统计上说,任何数学家或科学家在66岁时,都似乎已经不可能再有大的建树。但我仍在努力着,那25年异型思维的‘期’ 本来就是不正常的。这样我就还有希望,也许通过目前的研究或将来产生的新思想,我还能够做出一点有价值的东西。” 读到此处,不能不为之一叹,叹这个博弈论大师非凡的天才,叹他顽强的意志,和对科学毫无保留的执着之心!或许,这些也是爱莉西娅爱的源泉罢?

世事如棋局局新。前一辈人的辉煌和辛酸俱已成为历史,未来掌握在后来者的手中,取决于他(她) 们的每一个决定。我们的人生,又将会是一场什么样的博弈呢?

三,(下面是我收集到的一些例子,对其中的内容我自己作了一些修改,更简洁,即使你不是经济专业的学生也容易理解)

人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大程度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体的增加。

永不停息的博弈

人们的工作和生活,可以看做是永不停息的博弈决策过程。人们每天从一早醒来就必须不断地作决定,我们日复一日决定早餐要吃什么,直到养成固定的饮食习惯;要不要到超市疯狂购一番;要、在转盘赌局里下红或是下黑,甚至读一本书……不管有意无意,深思熟虑或一时冲动,你已经开始读这本书了——这就是一个决定。

还有更重大的:报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位。甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,这只不过是人生重大决策的几个例子。

在这些决策中,存在一个共同的因素,那就是你并不是一个人在作决定,在一个毫无干扰的真空世界里作决定。相反,你的身边充斥着和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果。鲁滨孙一个人沦落荒岛,做什么都是他自己说了算;可是等来了个“星期五”,他就要面对博弈问题了。

博弈论是由两位杰出的学者——冯·诺曼和摩根斯坦在上世纪中期创立的。用专业术语说,博弈论是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”。

为了解释和理解博弈决策的相互影响,我们不妨设想一个石匠的决策和一个拳击手的决策会有什么区别。当石匠考虑怎样开凿石头的时候,他的“对象”原则上是被动的和中立的,不会对他表现策略对抗。然而,当一名拳击手打算攻击对方要害的时候,不仅他的每一步都会招致抵抗,而且他还面临对方主动的攻击。他必须设法克服这些抵抗和攻击。

在人与人的博弈中,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的人,而不是被动的和中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含着潜在的合作因素。在你作决定的时候,必须将这些冲突考虑在内,同时注意发挥合作因素的作用。

为了自己,也为了与他人更好地合作,你需要学习一点博弈论的策略思维。正是因此,著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”

贴士:

博弈论说来有点绕嘴,但是内容还是很好理解的,那就是每个对弈者在决定取何种行动时?不但要根据自身的利益和目的行事,也要考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动,来寻求收益或效用的最大化。

游戏是人生的抽象

“博弈”这个词听起来高深莫测,其实它就是“游戏”的意思。更准确点说,是可以分出胜负的游戏。博弈论如果直译就是“游戏理论”。不妨说,博弈论是通过“玩游戏”获得人生竞争知识的。

游戏是什么?简单地说,游戏是人生的抽象。

比如国际象棋,有这样几种角色:国王、皇后、骑士、主教和小兵,俨然是一个政教兼具的小王国。当然,比照人生,这个模型是太简略了,但是一样可以反映人生的某些道理。而且,惟其简略,这些原本被生活的复杂表象所掩盖的道理才更清晰可见。

面对复杂事物时,人们常落入见树不见林的陷阱,被细节压得喘不过气来,找不到重点。而在游戏中,可以反映出一些现实世界的问题,并将干扰因素减至最低,是一种很适当的决策入门方法。

围棋可能是最简单也是最复杂的游戏,它源于4000年前的中国,但直到现在,我们也未必真弄懂了它。最简化的棋盘——纵横各19条线(最初是17条)编织成的一张网;最简化的棋子(只分黑白两色);最简单的规则(轮流下子,两气活棋,空多者胜,再加上一些“劫争”之类的补充规定),一个对围棋一无所知的人也能在几分钟内学会,可是它的玄妙深奥却又超过了任何一种棋类游戏。如果你对围棋下过一些工夫,你就一定能从中领悟某些哲理,例如“不输就是赢”、“流水不争先”、“乱中求胜”、“过犹不及”等等。在这一点上,游戏有些像我们从小阅读的寓言故事,我们不正是从这些“小中见大”的故事中学会生活的道理吗?

不要小看游戏,它的确是人生的模型。从小我们就是从游戏里学习怎样生活、怎样与他人相处、怎样适应并利用这世界上的种种规则,并在这个过程中确立自己的人格。因此,千万不要低估游戏,它确实能反映真正的人生。

贴士:

零和游戏:游戏者有输有赢,但整个游戏的总成绩永远为零。整个博弈的过程就是一个零和游戏。

从游戏到人生

一个参加了海湾战争的美国飞行员回国后,有人问他对战争的感想,他回答道:就像在玩电脑游戏。事实上,现在很多电脑游戏已经被应用于军事训练。“9·11”之后,微软的一款飞行游戏受到了关注,因为在游戏中,玩家可以体验驾驶飞机在纽约等大城市上空飞行的感觉,甚至可以从世贸大楼中间穿过。人们担心:恐怖分子可以借助这个游戏获得练习机会,或许他们已经这样做了。

游戏是学习的好方法。击败了拿破仑的威灵顿公爵曾说过:“滑铁卢之役的胜负是在伊顿中学操场上决定的。”平时勤于练习技巧和战术,在危急时才不致慌了手脚,这个原则适用于大多数的比赛或游戏。

最妙的是:在游戏过程中,你不会损失任何东西?当然除了部分自尊外 ,即使是输了也不会有什么损失。在大富翁的游戏中,你可以从一眨眼输掉几百万元的经验里,学会如何精明地买卖房地产,事后又不必付出任何代价。

当然,游戏各不相同,对游戏者的要求也不同。有些人长于思考性的游戏,但不同的运动项目对决策智慧有不同程度的要求,例如在拳击或相扑这样按“重量级”来划分比赛等级的游戏中,聪明才智就不那么重要了。

玩游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力、在法律界工作不能缺少的案例积累、玩围棋游戏的时候还需要记住大量的“定式”(双方可以接受的变化,可称为围棋盘上的“均衡”)等。这些技巧一旦脱离了游戏,可能就没有多大用处了。但博弈论的策略思维则是另外一种技巧。策略思维从你的基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来,这是具有普遍意义的原则,可以应用于生活的方方面面。

战略的筹划和博弈论的道理其实是相通的:你的决策必须赢过对手,个人、家庭、部族或国家才有活命的机会。

贴士:

法国著名女高音歌唱家玛·迪梅普莱有一个很大的私人园林。每逢周末,总是会有人到她的园林里花、拾蘑菇,更有甚者还在那里搭起了帐篷露营野餐。虽然管理人员多次在园林四周围上篱笆,还竖起了“私人园林,禁止入内”的木牌,可所有这些努力都无济于事。迪梅普莱知道了这种情况后,就吩咐管理人员制作了很多醒目的大牌子,上面写着“如果有人在园林中被毒蛇咬伤后,最近的医院距此15公里”的字样,并把它们立在园林四周。从此以后,再也没有人私自闯入她的园林了。——如果习惯的方法不能解决问题,就要调整自己的视角和观念。

多人博弈不可避免的矛盾

游戏不只限于两个对手,有很多游戏是多人参加的。如果后果要由许多人共同承担,那么整个决策过程将会更加困难;因为你将面临不同成员与不同目标的排列组合。而关于多人决策,可以通过小组对抗的模式来了解,在这类竞赛中,好的决策可以创造胜利。

真正的多人决策有许多不同的形态:有时候虽然参与决策人数众多,却只要一种意见,这是理想委员制;有些是两人共同参与决策,但却处于对立的状态,如角力、下棋、击剑、网球单打等;另外还有多人多意见的决策形态,如国会、联合国、牌局、政治党派等。姑且不论生活品质高低,这些决策的终极目标都是为了追求人类在地球上的永续生存。然而,虽有许多极重要的决策有待确定并付诸实施,但我们却没有一套理性的做法完全避免“三个和尚没水喝”之类的困境。每个决策者与选择方案的组合都自成一个系统,成就的决策好坏不一,也有些组合则完全无法运作。在某些情况下,根本不可能作出不自相矛盾的决策。

博弈是一种策略的相互依存状况:你的选择?即策略 将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。

不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同步行动过程,因此须将技巧综合起来,灵活运用,思考和决定自己最佳行动应该是什么。

贴士:

如果你离开双方相互适应的简单原则,那么你的聪明是不会有好结果的。

公平来自博弈

博弈不一定是坏事,也未必不能取得好的结果。我们今天享受的丰富的物质生活,都是来源于自由市场的竞争——同样也是博弈的结果。亚当斯密在1776年所发表的

四,罗伯特·奥曼的博弈论及其经济理论

诺贝尔经济学奖得主简介:

罗伯特·奥曼(robert j.aumann)1930年6月出生于法兰克福,1950年毕业于纽约大学并获数学学士学位。之后,又于1952年和1955年在麻省理工学院分别获得数学硕士学位和数学博士学位。1966年,罗伯特·奥曼被选为经济计量协会会员,现任耶路撒冷希伯莱大学数学研究院教授、纽约州立大学斯坦尼分校经济系和决策科学院教授以及以色列数学俱乐部、美国经济联合会荣誉会员等。他担任多家专业杂志社的编辑,如《国际对策论杂志》、《数理经济学杂志》、《经济学理论杂志》、《经济计量学》、《运筹学数学》、《应用数学和博弈和经济行为的siam杂志》等。

罗伯特·奥曼作为一名杰出的经济学家

什么是博弈

序章

人生是永不停息的博弈过程,博弈意味着通过选择合适策略达到合意结果。作为博弈者,最佳策略是最大程度地利用游戏规则;作为社会的最佳策略,是通过规则引导社会整体的增加。

永不停息的博弈

人们的工作和生活,可以看做是永不停息的博弈决策过程。人们每天从一早醒来就必须不断地作决定,我们日复一日决定早餐要吃什么,直到养成固定的饮食习惯;要不要到超市疯狂购一番;要不要看场**、散散步、买部车、把菜吃完、在转盘赌局里下红或是下黑,甚至读一本书……不管有意无意,深思熟虑或一时冲动,你已经开始读这本书了——这就是一个决定。

还有更重大的:报考什么学校、选择什么专业、从事什么样的工作、怎样开展一项研究、如何打理生意、该和谁合作、做不做兼职、要不要辞掉工作、要不要竞争总裁的职位。甚至是要不要结婚、什么时候结婚、该和谁结婚、要不要孩子、怎样将孩子抚养成人等,这只不过是人生重大决策的几个例子。

在这些决策中,存在一个共同的因素,那就是你并不是一个人在作决定,在一个毫无干扰的真空世界里作决定。相反,你的身边充斥着和你一样的决策者,他们的选择与你的选择相互作用。这种互动关系自然会对你的思维和行动产生重要的影响,而且别人的选择和决策直接影响着你的决策结果。鲁滨孙一个人沦落荒岛,做什么都是他自己说了算;可是等来了个“星期五”,他就要面对博弈问题了。

博弈论是由两位杰出的学者——冯·诺曼和摩根斯坦在上世纪中期创立的。用专业术语说,博弈论是“研究决策主体的行为在直接相互作用时,人们如何进行决策、以及这种决策如何达到均衡的问题”。

为了解释和理解博弈决策的相互影响,我们不妨设想一个石匠的决策和一个拳击手的决策会有什么区别。当石匠考虑怎样开凿石头的时候,他的“对象”原则上是被动的和中立的,不会对他表现策略对抗。然而,当一名拳击手打算攻击对方要害的时候,不仅他的每一步都会招致抵抗,而且他还面临对方主动的攻击。他必须设法克服这些抵抗和攻击。

在人与人的博弈中,你必须意识到,你的商业对手、未来伴侣乃至你的孩子都是聪明而有主见的人,是关心自己利益的活生生的人,而不是被动的和中立的角色。一方面,他们的目标常常与你的目标发生冲突;另一方面,他们当中包含着潜在的合作因素。在你作决定的时候,必须将这些冲突考虑在内,同时注意发挥合作因素的作用。

为了自己,也为了与他人更好地合作,你需要学习一点博弈论的策略思维。正是因此,著名经济学家保罗·萨缪尔森说:“要想在现代社会做一个有文化的人,你必须对博弈论有一个大致了解。”

贴士:

博弈论说来有点绕嘴,但是内容还是很好理解的,那就是每个对弈者在决定取何种行动时?不但要根据自身的利益和目的行事,也要考虑到他的决策行为对其他人的可能影响,以及其他人的行为对他的可能影响,通过选择最佳行动,来寻求收益或效用的最大化。

游戏是人生的抽象

“博弈”这个词听起来高深莫测,其实它就是“游戏”的意思。更准确点说,是可以分出胜负的游戏。博弈论如果直译就是“游戏理论”。不妨说,博弈论是通过“玩游戏”获得人生竞争知识的。

游戏是什么?简单地说,游戏是人生的抽象。

比如国际象棋,有这样几种角色:国王、皇后、骑士、主教和小兵,俨然是一个政教兼具的小王国。当然,比照人生,这个模型是太简略了,但是一样可以反映人生的某些道理。而且,惟其简略,这些原本被生活的复杂表象所掩盖的道理才更清晰可见。

面对复杂事物时,人们常落入见树不见林的陷阱,被细节压得喘不过气来,找不到重点。而在游戏中,可以反映出一些现实世界的问题,并将干扰因素减至最低,是一种很适当的决策入门方法。

围棋可能是最简单也是最复杂的游戏,它源于4000年前的中国,但直到现在,我们也未必真弄懂了它。最简化的棋盘——纵横各19条线(最初是17条)编织成的一张网;最简化的棋子(只分黑白两色);最简单的规则(轮流下子,两气活棋,空多者胜,再加上一些“劫争”之类的补充规定),一个对围棋一无所知的人也能在几分钟内学会,可是它的玄妙深奥却又超过了任何一种棋类游戏。如果你对围棋下过一些工夫,你就一定能从中领悟某些哲理,例如“不输就是赢”、“流水不争先”、“乱中求胜”、“过犹不及”等等。在这一点上,游戏有些像我们从小阅读的寓言故事,我们不正是从这些“小中见大”的故事中学会生活的道理吗?

不要小看游戏,它的确是人生的模型。从小我们就是从游戏里学习怎样生活、怎样与他人相处、怎样适应并利用这世界上的种种规则,并在这个过程中确立自己的人格。因此,千万不要低估游戏,它确实能反映真正的人生。

贴士:

零和游戏:游戏者有输有赢,但整个游戏的总成绩永远为零。整个博弈的过程就是一个零和游戏。

从游戏到人生

一个参加了海湾战争的美国飞行员回国后,有人问他对战争的感想,他回答道:就像在玩电脑游戏。事实上,现在很多电脑游戏已经被应用于军事训练。“9·11”之后,微软的一款飞行游戏受到了关注,因为在游戏中,玩家可以体验驾驶飞机在纽约等大城市上空飞行的感觉,甚至可以从世贸大楼中间穿过。人们担心:恐怖分子可以借助这个游戏获得练习机会,或许他们已经这样做了。

游戏是学习的好方法。击败了拿破仑的威灵顿公爵曾说过:“滑铁卢之役的胜负是在伊顿中学操场上决定的。”平时勤于练习技巧和战术,在危急时才不致慌了手脚,这个原则适用于大多数的比赛或游戏。

最妙的是:在游戏过程中,你不会损失任何东西?当然除了部分自尊外 ,即使是输了也不会有什么损失。在大富翁的游戏中,你可以从一眨眼输掉几百万元的经验里,学会如何精明地买卖房地产,事后又不必付出任何代价。

当然,游戏各不相同,对游戏者的要求也不同。有些人长于思考性的游戏,但不同的运动项目对决策智慧有不同程度的要求,例如在拳击或相扑这样按“重量级”来划分比赛等级的游戏中,聪明才智就不那么重要了。

玩游戏需要用到许多不同类型的技巧。其中一种是基本技巧,比如打篮球不能缺少的投篮能力、在法律界工作不能缺少的案例积累、玩围棋游戏的时候还需要记住大量的“定式”(双方可以接受的变化,可称为围棋盘上的“均衡”)等。这些技巧一旦脱离了游戏,可能就没有多大用处了。但博弈论的策略思维则是另外一种技巧。策略思维从你的基本技巧出发,考虑的是怎样将这些基本技巧最大限度地发挥出来,这是具有普遍意义的原则,可以应用于生活的方方面面。

战略的筹划和博弈论的道理其实是相通的:你的决策必须赢过对手,个人、家庭、部族或国家才有活命的机会。

贴士:

法国著名女高音歌唱家玛·迪梅普莱有一个很大的私人园林。每逢周末,总是会有人到她的园林里花、拾蘑菇,更有甚者还在那里搭起了帐篷露营野餐。虽然管理人员多次在园林四周围上篱笆,还竖起了“私人园林,禁止入内”的木牌,可所有这些努力都无济于事。迪梅普莱知道了这种情况后,就吩咐管理人员制作了很多醒目的大牌子,上面写着“如果有人在园林中被毒蛇咬伤后,最近的医院距此15公里”的字样,并把它们立在园林四周。从此以后,再也没有人私自闯入她的园林了。——如果习惯的方法不能解决问题,就要调整自己的视角和观念。

多人博弈不可避免的矛盾

游戏不只限于两个对手,有很多游戏是多人参加的。如果后果要由许多人共同承担,那么整个决策过程将会更加困难;因为你将面临不同成员与不同目标的排列组合。而关于多人决策,可以通过小组对抗的模式来了解,在这类竞赛中,好的决策可以创造胜利。

真正的多人决策有许多不同的形态:有时候虽然参与决策人数众多,却只要一种意见,这是理想委员制;有些是两人共同参与决策,但却处于对立的状态,如角力、下棋、击剑、网球单打等;另外还有多人多意见的决策形态,如国会、联合国、牌局、政治党派等。姑且不论生活品质高低,这些决策的终极目标都是为了追求人类在地球上的永续生存。然而,虽有许多极重要的决策有待确定并付诸实施,但我们却没有一套理性的做法完全避免“三个和尚没水喝”之类的困境。每个决策者与选择方案的组合都自成一个系统,成就的决策好坏不一,也有些组合则完全无法运作。在某些情况下,根本不可能作出不自相矛盾的决策。

博弈是一种策略的相互依存状况:你的选择?即策略 将会得到什么结果,取决于另一个或者另一群有目的的行动者的选择。处于一个博弈中的决策者称为参与者,而他们的选择称为行动。一个博弈当中的参与者的利益可能严格对立,一人所得永远等于另一人所失。这样的博弈称为零和博弈。

不过,更常见的情况是,既有共同利益,也有利益冲突,从而可能出现导致共同受益或者共同受害的策略组合。在实践当中,博弈可能包含一些相继行动过程,也可能包含一些同步行动过程,因此须将技巧综合起来,灵活运用,思考和决定自己最佳行动应该是什么。

贴士:

如果你离开双方相互适应的简单原则,那么你的聪明是不会有好结果的。

公平来自博弈

博弈不一定是坏事,也未必不能取得好的结果。我们今天享受的丰富的物质生活,都是来源于自由市场的竞争——同样也是博弈的结果。

本文到此结束,希望对大家有所帮助。

标签:囚徒困境
剩余:2000