Chapter 5 第五章 动态博弈

所谓动态博弈,就是局中人按顺序先后采取行动的博弈。本章将为大家介绍动态博弈的基础知识、具有代表性的博弈模型以及策略的操纵。我们将一起学习博弈的展开型表述形式——“树形”,以及从收益反向追溯策略的逆向归纳法,从而推动博弈向有利的方向发展。

20数字游戏的必胜之法

~动态博弈/逆向归纳法~

◎例题5-1 20数字游戏

现在给大家介绍一个数字游戏。两个人做游戏,一个人先从1~20的数字中选一个数字说出来,然后另一个人接着他的数字往下数,轮流数下去,谁先数到20谁就获胜。每个人一次可以说一个数字,也可以说两个连续的数字。比如,可以说“1”,也可以说“1、2”。在这个游戏中,先说的人有必胜之法。你知道是什么方法吗?

这个例题是一个简单的动态博弈。局中人可以了解对方的策略,然后根据对方的策略来制定自己的策略。这个游戏的必胜之法,可以通过从后往前数,分析出来。

游戏规则规定,谁先数到“20”谁就赢。那么,获胜的方法有两个,一个是数到“20”,另一个是数到“19、20”。因此,只要想办法让对方从18开始数起,我们就赢定了。因为那样的话,对方就只能数“18”或者“18、19”,接下来我们就可以数“19、20”或者“20”。也就是说,先说的人,只要让自己数到“17”就行了。按照同样的道理继续往前追溯,我们会发现,只要先说的人数到“14”“11”“8”“5”“2”就可以赢。也就是说,先说的人应该先数“1、2”,这样就可以必胜了。真的是这样吗?赶快找个身边的亲戚、朋友、同学、同事试一下吧。

在动态博弈中,我们可以根据双方最后的收益,反向分析策略的运用。这种方法叫作逆向归纳法。这是研究动态博弈的一个非常重要的方法,所以请你一定要牢记。

博弈树形的绘制方法

~用博弈树形来表述动态~

在前面的章节中,我们主要讲解的是静态博弈,而且大多是用策略型的收益表来表述静态博弈。在这一章中,我们主要讲解动态博弈,这次我们用展开型来表述。展开型就是用树状图形来表示,所以也通称为“博弈树形”。

绘制博弈树形,首先要确定一个初始点,博弈就是从这一点开始的。如果用一棵树进行比喻的话,这个初始点就相当于“树根”。从初始点开始,延伸出线条,表示先采取策略的局中人A的策略选择。这些线条相当于“树枝”。在局中人A的“树枝”上,局中人B会做出策略选择,像初始点一样,会从“树枝”的某一点上延伸出B的线条。这一点就叫作“策略决定点”或“节点”。为了与初始点进行区别,节点用实心圆表示,初始点用空心圆表示。在树枝的最末端,可以总结出局中人最终的收益。博弈树形一般可以从下往上展开,也可以从左往右展开。

绘制博弈树形的基本规则是:

·所有“树枝”、节点,都必须与“树根”有联系;

·“树枝”之间不能发生交叉。

有的时候,对于没有被采纳的“树枝”,要用双横线勾掉。这被形象地称为“剪枝”。

让老板给自己加薪的方法

~加薪谈判博弈/策略的操纵——“威胁”①~

在动态博弈中,因为是按顺序先后实施策略,所以局中人可以了解对方的策略,并且在分析对方策略的基础上做出自己的选择。也就是说,自己的策略可以对对方施加影响,反过来,自己也会受到对方策略的影响。我们可以使用一系列策略影响对方制定策略的思路,从而使博弈向着有利于自己的方向发展。这就叫作“策略操纵”,具有代表性的就是“威胁”和“明确表态”。威胁是策略操纵中经常使用的手段,比如强迫别人做某件事的时候,可以说:“你不做的话,我就……”阻止别人做某件事的时候,就说:“你不要那么做!否则我就……”我们通过下面的例题来分析一下威胁策略会给对方带来什么样的影响。

◎例题5-2加薪谈判博弈

你在一家公司已经工作了有些年头,也对公司做出了很多有益的贡献。但是,你觉得公司给的薪水太低了,和你的付出不成正比。于是,你直接去找总经理商讨加薪的事情。可是你心里清楚,以前跟总经理提出“加薪10%”的时候,基本上都被驳回了。这次你该把谈判的重点放在哪里呢?或者说,你有什么筹码呢?

我们首先站在总经理的角度来考虑一下这个问题。对于总经理来说,利润是公司的头等大事。如果增加员工的薪水,就会增加成本,降低利润,所以他会尽量抑制薪水的上涨。但是,公司的利润又是员工辛勤工作创造出来的,如果不给员工加薪,他们就不愿意努力工作,甚至有辞职走人的可能。尤其是像你这样的优秀员工,如果让总经理意识到不加薪你就可能辞职的话,这场谈判就会朝着对你有利的方向发展。

~加薪谈判博弈/策略的操纵——“威胁”②~

这场博弈是从你“要求加薪”开始的。当总经理接到员工的加薪请求时,他可以采取的策略我们姑且设定为两个:“加薪”和“不加薪”。我们把初始点放在总经理身上,从他身上延伸出两条线,一条是“加薪”,一条是“不加薪”。

如果总经理同意加薪,那么你得到10%的加薪,这个博弈就结束了。如果总经理不同意加薪,你也准备了两个策略——“辞职”和“不辞职”。如果你辞职的话,公司和总经理就会失去你这样一个优秀的员工,之后为公司创造利润的人就会少一个。如果你不辞职的话,一切就都没有改变,你拿着原来的薪水干着不变的工作。

我们先来绘制一张博弈树形图。从上面往下看我们可以发现,当总经理选择“不加薪”的策略时,你必须让他清楚,你会选择“辞职”的策略。换句话说,就是你威胁总经理说:“不给我加薪的话,我真的要辞职了!”一定要让对方觉得你是动真格的了。如果总经理感觉“那家伙不过是说说罢了,我不给他涨工资,他也不会辞职的”,那你就失败了。

为了提高你的威胁的可信度,你有必要散布一些附加信息。比如,你在同事中宣扬,说你已经找到一家公司愿意出更高的薪水来雇用你。而且,不要悄悄地和总经理谈判,要事先在同事面前广泛地散布这个消息,对他们说:“要是总经理不给我加薪,我就走人!”这样一来,如果加薪谈判失败,你还留在公司里就会成为众人的笑柄,到时候恐怕很难继续在公司工作了。让总经理感受到你已经把自己推到悬崖边上,他就会认真考虑你的加薪要求了。

遇到强盗,应该屈服吗?

~强盗的策略/“威胁”的可信度①~

一天晚上,参加聚会之后,时间已经很晚,你一个人独自走在回家的路上。当你走出繁华的商业街,在往地铁站走去的小路上,突然背后传来一个声音:“把钱交出来!否则我就开枪!”与此同时,你感觉到一个坚硬的物体顶在自己的后背上。我们来分析一下这个博弈。局中人有两个,你和强盗,当前的状态可以用动态博弈来表示。

强盗用一个疑似枪的物体顶住了你的后背,这是一个初始点。此时可供你选择的策略有两个:“交出钱包”或“不交”。这个强盗到底是谁,你不知道,他手里拿的那个东西是不是真枪,里面有没有子弹,你也不清楚。

如果你乖乖交出钱包,可以保住性命,但钱包里的现金、银行卡就会被抢走。我们将这种情况的收益设定为-5。站在强盗的角度看,抢来的钱包中除了现金之外,其他东西都没什么用处,所以他的收益是4。如果你选择拒绝交出钱包,那么强盗可以选择的策略有“开枪”或“逃走”。如果强盗开枪的话,你可能受重伤甚至死亡,所以你的收益是-10。强盗打伤或打死你,抢到钱包,这时他的收益是3。如果强盗选择逃跑的话,你的生命安全和钱财都不会有损失,只是会留下一段恐怖的记忆,你的收益是-1。强盗逃跑的话,他获得的只有被警察逮捕的风险,所以他的收益是-1。

当你选择“不交出钱包”的时候,强盗“逃走”的话,你的收益最高。可是,强盗的收益又会怎样呢?如果你“不交出钱包”的话,与“逃走”相比,强盗有一个更高收益的选择,那就是“开枪”。由此可见,强盗发出威胁“把钱交出来!否则我就开枪!”的可信度还是很高的。

~强盗的策略/“威胁”的可信度②~

假设你遇到了和前一小节一样的情况,被强盗劫持了,可是这次强盗手里拿的不是疑似枪的物体,而是一个雷管,强盗对你说:“把钱交出来!否则炸死你!”

此时如果你选择“交出钱包”,那就和前面一样,这场博弈到此结束。如果你选择“不交出钱包”,而强盗选择“逃走”的话,那你们双方的收益也和前一小节博弈中的一样。但是,当你选择“不交出钱包”,而强盗选择“引爆雷管”时,情况就大不一样了。你可能在爆炸中受重伤,最严重的情况也可能丧命。这种情况下你的收益是-10,而强盗肯定也会被炸伤甚至死亡,因此他的收益和你一样,也是-10。强盗的武器由枪变成雷管后,他也要承担被武器损伤的后果。

也就是说,如果强盗使用的武器是枪的话,那么当你选择“不交出钱包”时,强盗的最优反应是“开枪”。但如果强盗的武器换成了雷管,那么当你选择“不交出钱包”时,强盗的最优反应应该是“逃走”。换句话说,“把钱交出来!否则炸死你!”这种威胁的可信度很低。在生意的世界中,我们就常遇到这种“吓唬人的威胁”。如果仅凭感觉进行判断的话,往往容易被对方吓住,但如果用博弈论的理论作为武器,就能很容易地分辨出威胁的真伪。

这个博弈也可以从最后的收益往前追溯分析,用逆向归纳法找到正确的策略。

没有退路可走,也是一种力量

~背水一战/策略操纵——“明确表态”~

除了“威胁”之外,“明确表态”也是一种操纵策略的方法。“明确表态”,顾名思义就是明确地表达自己的态度、立场,以影响对方的决策。其实,在序章中“放弃一些选项”和第86~91页的“斗鸡博弈”中,都涉及“明确表态”的策略。

我们这次用展开型来表述序章第6页中的博弈。你的国家和敌国都有“进攻”或“撤退”的策略可选。如果你选择“进攻”而敌国也选择“进攻”的话,因为你的国家实力弱于敌国,所以两国交战之后贵国的收益是-100,敌国的收益是-50。如果你选择“进攻”而敌国选择“撤退”的话,那么贵国的收益是10,敌国的收益是-20。如果你选择“撤退”而敌国选择“进攻”的话,那么贵国的收益是-50,敌国的收益是100。如果两国都选择“撤退”,那么双方的收益都是0。我们先来绘制一张收益表,从收益表中我们可以看出,这个博弈存在两个纳什均衡:贵国“进攻”、敌国“撤退”和贵国“撤退”、敌国“进攻”。但是,我们并不知道该选择哪一个纳什均衡。

于是,我们把这个博弈看作动态博弈,然后用博弈树形来加以分析。结果发现,为了将这场博弈引向对自己有利的纳什均衡,贵国首先不能选择“撤退”。所以,你应该向敌国表明自己将要“进攻”的态度。而且,为了让敌国和本国军民相信你只有“进攻”这一种策略可以选择,或者说让他们看到你选择“进攻”的决心,将城里储存的食物扔掉,这就是一种有效的“明确表态”的方法。这样的行动可以对敌国起到震慑作用,也可以增强本国军民战斗到底的决心,并最终让博弈朝着有利于自己的方向发展。

成功开拓新市场的企业和失败的企业

~开拓新市场的博弈/开拓老年人旅游的新市场①~

在商业领域,有些行业已经非常成熟,很多企业在这些行业中已经打拼多年,能够稳定地赢利,甚至有些巨型企业呈现出垄断其所处行业的倾向。但是,也有一些企业想中途涉足,希望在这个行业中找到自己的立足之地。但是,对于新加入的企业来说,想在成熟的市场中站稳脚跟并不是那么容易的,因为会遇到各种各样的障碍和困难。

美国著名的经营管理学家迈克尔·波特在其著作《竞争战略》中列出了八项具体的条目来衡量开拓新市场时遇到的障碍的大小。这八条分别是:“确保流通渠道的难易度”“产品差别化的存在”“巨额投资的必要性”“更换供货商所产生的成本的大小”“规模经济是否起作用”“在规模经济之外的成本方面存在的不利性”“政府政策对企业加入新市场的限制”“该行业中现有企业进行报复的可能性”。

接下来我们就把企业进军新市场时的状况用博弈树形来进行分析,用博弈论的理论来分别思考一下该行业中现有垄断企业可能做出的防御对策,以及新进企业的策略要点。假设有一家高级猴子旅游公司(S公司)想要进军老年人的旅游市场,而老年人的旅游市场几乎被大猩猩观光公司(G公司)独占着。在这种情况下,如果S公司不进入这个市场,那么S公司的收益是0,与此同时,G公司将维持他们在该市场中的利润,所以收益是40。如果S公司加入进来的话,G公司有两种策略可以选择,一是“融合”,二是“反抗”。如果G公司选择“融合”,那么这个市场原有的价格可以维持,结果S公司的收益是10,G公司的收益是20。如果G公司选择“反抗”的话,他们会压低价格以吸引顾客。这时,S公司可以选择停止加入该市场,即“退出”,也可以选择参与价格竞争,即“对抗”。S公司选择“退出”的话,G公司的收益是30,S公司的收益是-10,因为之前付出的成本已经不能收回了。如果S公司选择“对抗”的话,那么两家公司将陷入价格竞争的消耗战,我们推测G公司的收益是10,而S公司的收益将是-20。

当设定好所有收益之后,我们就采用逆向归纳法从后往前分析。先看最终的最高收益,S公司的最高收益出现在S公司加入,而G公司选择“融合”策略的时候。但是,S公司不知道G公司到底会选择“融合”还是“反抗”。如果G公司选择“反抗”的话,那么对于S公司来说,与“对抗”相比,选择“退出”的收益似乎更高一些。G公司通过合理的思考,他们不会选择收益较小的“融合”,而应该选择“反抗”。这样看来,S公司还是从一开始就不要进军这个市场比较好。

~开拓新市场的博弈/开拓老年人旅游的新市场②~

如果G公司没把S公司放在眼里,知道很快就可以把它们赶出这个市场的话,也许G公司采取的“反抗”策略就不会太激烈。只要利用自己现有的渠道和客户群,推出一款S公司无法对抗的新的旅游产品,就可以在不打价格战、不损害自己利益的情况下,将S公司驱逐出去。而对此,S公司可以用“明确表态”的策略给G公司施加压力。比如S公司前期投入大量资金,让G公司看到“我们已经没有退路,必须战斗到底”。当这种威胁的可信度非常高的时候,G公司为了避免在竞争中蒙受巨大的损失,就可能降低“反抗”的姿态。而S公司因为前期投资非常大,如果“退出”的话,损失将会异常惨重。于是,这个时候博弈树形就发生了变化(表5-4)。当G公司“反抗”的时候,对于S公司来说,选择“对抗”比“退出”的收益要高一些。

另外,S公司还可以选择不和G公司发生直接碰撞的间隙市场作为出发点。间隙市场规模比较小,即使获得成功,收益也不会太大,但初期投资也花费不了多少(图5-5)。在这种状况下,市场中现有的企业——弯弯旅行社(W社)即使以降低价格的策略进行“反抗”,S公司受到的损害也不大。结果,S公司成功实现了进军新市场的目标。

从间隙市场入手,取得成功的典型案例就是美国的西南航空公司。他们把目光聚焦在国内城市之间的短距离航线,以低廉的价格提供航空服务。他们的飞机就像“在天空中飞行的公共汽车”。“低廉的机票价格”“频繁地飞行”是他们的基本方针。在开航当时,从洛杉矶到菲尼克斯(凤凰城)每天甚至能飞40个班次。

另外,原本飞机上都是指定席位,但他们将其改革成自由席位,从而极大限度地简化了登机手续。美国西南航空公司通过进行彻底的人性化、合理化的改革,压缩了初期成本和运行成本,在大型航空公司不愿涉足的间隙市场取得了巨大的成功。

软银集团涉足移动通信领域的策略

~开拓新市场的博弈/进军移动通信市场①~

现实中,每天都有新企业诞生,也有老企业进军新市场。其中,日本的软银集团(SoftBank,以下简称SB集团)在2006年进军移动通讯领域的时候,就打了一场漂亮的战役。他们制作的名为“白户家”的电视广告非常有趣,极大地提高了观众对SB集团的好感。然后,SB集团又在智能手机市场中通过与苹果公司签约,牵制了竞争对手DoCoMo(以下简称D公司)。总之,SB集团采用了一系列积极进攻的手段。

移动通信市场可不是一个简单就能涉足的领域,甚至可以说是非常艰难的,因为需要“巨额的资金投入”。现实中就有不少企业贸然进军移动通信市场,结果发现需要的资金比预想的高出很多,最终导致破产。可是,一旦成功的话,就能获得巨额的回报。

接下来,我就为大家简单地介绍一下SB集团成功进入移动通信领域的经过,我们一起来分析一下他们成功的经验。如果SB集团不进入这个市场,我们假设原本这个市场的垄断者D公司的收益是100。如果SB集团选择加入进来,那么D公司可以选择“融合”或者“反抗”。如果D公司选择“融合”,那么两家公司可以维持市场中的高价格,双方分享整个市场。假设两家公司平分市场的话,那么两者的收益都是50,如果将SB集团进军这个市场的成本设定为15的话,那么SB集团的最终收益是35。

如果D公司进行“反抗”,降低价格,想以价格竞争拖垮SB集团的话,那么SB集团可以选择“退出”或者“对抗”。根据D公司“反抗”的强度,SB集团、D公司的收益可能会出现较大的差异。如果SB集团选择“退出”,那么前期投入的成本无法收回,因此最终收益只有-15。而D公司在采取“反抗”措施的时候花去了10的促销成本,因此D公司的最终收益是100-10=90。如果SB集团采取低价格策略与D公司“对抗”的话,结果又会怎样呢?假设在价格竞争中,两家企业的利润都折半了,那么双方的收益就都是25,而且还要减去促销成本10,结果双方的收益就都是15。不仅如此,SB集团还要减去前期投入的资金15,最终的收益是0。另一方面,D公司最终的收益是15(图5-6)。

面对这种情况,SB集团的经营者想,如果要从零开始涉足移动通信市场,首先要投入巨额的资金建设基站,之后在与竞争对手的打拼中还难以取得胜利。于是,SB集团决定初期先借用合作伙伴的通信网为客户提供通信服务。然而,在和沃达丰公司谈判的过程中,“借”通信网变成了“买”通信网。经过艰苦的谈判,最终SB集团以1兆7500亿日元的价格收购了沃达丰日本分公司。这是除了金融机构的并购之外,日本企业并购市场上企业并购的最高金额。

~开拓新市场的博弈/进军移动通信市场②~

我们把SB集团采取的策略和实际情况综合分析一下。

1.降低加入成本

SB集团收购沃达丰日本分公司的金额高达1兆7500亿日元,看起来加入的成本相当高。但是,收购了沃达丰日本分公司之后,就不用从零开始建设基站了,而且还直接接收了沃达丰日本分公司已有的1500万客户和1800家店铺。总体上来说,这比从无到有地重新建设,节省了不少资金投入。

2.该行业现存企业的应对策略

在SB集团加入移动通信领域之前,该市场中已经有D公司和KDDI公司。当SB集团进入这一领域时,现存的两家公司采取了“融合”策略。原本SB集团打算进入这个市场之后,首先以降低服务价格的方式来开拓市场,可是真正进入市场之后,发现其他两家公司回避了价格竞争。这两家公司并没有调整价格,也没有采取什么特殊的应对措施。在这种情况下,SB集团提出了一个低价格策略,即SB集团的客户之间通话和发送短消息是免费的。这一策略具有相当大的冲击性,确实提高了SB集团的市场份额。结果,SB集团非常成功地加入了移动通信行业。

3.月租策略

看到SB集团通过低价格策略不断扩大市场,其他两家公司也急忙开始降价促销。有的公司推出存话费免费赠送手机活动,有的公司则推出手机以旧换新服务。这时,SB集团推出的优惠政策是预存两年月租费,就可以享受话费与月租费相抵的活动。对客户来说,就相当于两年之内零月租。这样一来,至少可以将现有顾客保留两年。

第五章 总结

◎在动态博弈中,采取从结果往回分析的方式寻找最佳解决方案的方法很有效,这种方法叫作逆向归纳法。

◎在和老板的加薪谈判中,事先要放出一些口风,让老板相信“不加薪,我就辞职”。

◎在涉足新市场的时候,如果前期投入太高、竞争公司又采取对抗策略的话,就很难成功。

《石头剪刀布博弈心理学》