本帖最后由 lzqggg 于 2016-1-3 20:31 编辑 $ @/ P( Y* } a' j9 {3 @
: o' }6 F% f. H) D* y' @" g
严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
+ k, W: P7 a- b3 ]2 H# q, [ 以下三个定义:. a% \" m6 o; o/ V- A
所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
$ x* |) g# O9 A) I; a; _ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
" ~, _& F( n& y 所谓的双方优势策略则是指双方利益总和最大的策略。
1 z1 D4 k8 ^& L% |: j% W1 Y: T[编辑本段]严格优势策略举例分析
+ g* S J8 n7 b8 P6 ^, t( Q. f 一、经典的囚徒困境 ! P6 h' a, \4 m
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; N/ ^" T( [+ T/ j: _ 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 G3 ^! w* u. q; P 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
2 w0 M" e+ X0 {. m5 ? 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
! b/ X6 X2 L& f( N 若二人都互相检举(互相“背叛”),则二人同样判监2年。: [$ q" b2 ?4 J. s u n. N9 ]
# D. F, a6 Z3 _; M, K用表格概述如下:
! T- X, g6 s- r# L2 { [. K6 E4 N( {& o) ]4 W0 a1 C2 W1 g
甲沉默(合作) 甲认罪(背叛) 8 m' w2 }6 g$ k' I5 \1 ]
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 5 U4 R# N s( @9 }% v% T4 Q. D
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
" v/ e @& u- M1 L. s0 J; `! _5 B+ ^5 S/ }: I
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
6 {) V3 \# x% |; J5 u0 K0 X 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : F- k, l$ m- I% M' c/ F$ `7 m6 p
若对方沉默、背叛会让我获释,所以会选择背叛。 5 P1 d$ E- i) M% V& w6 m, T
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 n3 q3 x" P5 w1 s5 z* X
二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 + I: x' O# z4 n
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 - A: w2 t2 x/ I- h5 l/ m
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。3 q& a8 r. ^( x& R
[编辑本段]二、智猪博弈理论6 k/ {# @4 Z! ~! N
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; K# [& g5 P1 k4 r$ `( i
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : G: `1 E/ N d \1 M- G. ?
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 # r5 t! V r) Y* U/ A4 s" P
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: {4 j& Z; {! \0 Q" ~2 u* b5 ?" | “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
( w3 ^: q7 p. [: A/ p( X 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 i+ Z# o4 y; H1 A2 c8 l 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 q2 f* H F5 w: B) w ? " y& v2 S- E; n, ~" m& n* D
三、关于企业价格策略
) t2 [5 v6 v2 a7 X( M4 d9 m4 {9 n( W! B. u5 U4 |0 v6 F
& p3 |' A* b2 P% `0 N
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
- U# C) J, v; m5 L6 M 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
2 P5 r) w0 K+ r/ U' v, \; b# `: L 以下三个定义:
: b7 X" G Y7 y+ c4 G, D* C 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
' V* E7 S* \4 }! V$ K# m 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 w. V* |( d: u3 `9 _7 j" T6 |
所谓的双方优势策略则是指双方利益总和最大的策略。
O" `" g8 R% L I[编辑本段]严格优势策略举例分析
! f/ m+ _* v7 V! g Y6 ~ 一、经典的囚徒困境
. N8 u) T- J3 Y 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
! W* a' @- M. r$ c& T+ z 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: + \' m2 v6 y. E8 @" }% f8 ~( q# `
若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
' |2 G" _3 L3 }$ m3 V 若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 , j" s0 l* `2 W8 V6 T$ b
若二人都互相检举(互相“背叛”),则二人同样判监2年。; e; A& [ ]7 { s: {6 X$ y
3 |8 ^6 N2 l: i用表格概述如下:; K: |; y% x0 Y& E" W0 m; m
: A m# U, j/ C/ e! e! z, C g( t+ i0 e 甲沉默(合作) 甲认罪(背叛)
1 y9 j% b: T- M5 l乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 $ p# X4 j) c, N- X) B
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 ; d& }# c; _ D1 i; l( }# C! S
8 f: m' }9 {) `' }6 R9 @# v
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 6 T- I; r, q" B$ c$ t. Z3 Q
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 1 G& f4 z: y U9 q; z% E
若对方沉默、背叛会让我获释,所以会选择背叛。 + \/ Y& j+ W# c$ q7 R+ U: Y1 H
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; F9 j2 w# z; M/ e% `; P5 ` 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 M7 I& ?: Y8 ~; h5 K: Y5 a Z 这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
5 A0 K, X0 @: f* k% F 在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。/ ~$ ]+ B5 b9 Q! {
[编辑本段]二、智猪博弈理论6 ] S% U$ I& q1 U
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 , @- g# T# N7 x! H: {6 h
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 : H$ v6 ?& v1 ~; ^3 U% T
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 5 ?) D6 b! J! n/ G
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
: i8 ^, v6 e+ @ “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
! b4 Z& ` w+ f 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
# p: q+ A' R- D: c5 V' X4 L; r 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。6 j# r0 }" @ _& G) {4 }" ?
! O B' M0 _5 y1 v6 P3 R2 f
三、关于企业价格策略6 u8 r9 I% i: q4 S! ^
6 T3 J2 c9 ?" k: l3 O
9 y2 ~3 y/ \. ]1 W9 A% R J1 P9 F 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? / K; J0 k/ v. v" @3 R
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);4 B1 O- m0 w5 `
以下三个定义:
4 s, n; u8 A/ | 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 ' |0 u& K. U0 Z: Y2 R8 x
所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 5 ]. n4 O) v# _% O- P: R+ k0 n
所谓的双方优势策略则是指双方利益总和最大的策略。 ) U6 p3 m9 w8 S" S& j7 Z0 D
[编辑本段]严格优势策略举例分析9 f% ~; h1 U% u9 Z
一、经典的囚徒困境
0 r6 p: M7 I# ]% U8 A 1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: : o, i4 y6 `6 H, {1 S" o* I
警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
; ^- q+ |9 i7 b, r 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 * {& i* M2 F( h/ [, y$ F; n
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
3 A" K* e' g. m1 Y) _9 L& U 若二人都互相检举(互相“背叛”),则二人同样判监2年。; K) O/ a6 O- |: q% j' e
9 }% ?* C0 t M& h$ n( z用表格概述如下:" E# u+ P7 p2 W: j' w' R& M2 E3 I4 O3 t
" v4 m! c) ?+ b' I( R$ _) k0 s( h 甲沉默(合作) 甲认罪(背叛) " V" O5 }& [. l8 c! d. P
乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 - C9 P3 G0 R+ |
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年
% g$ a9 f* }6 v/ Z
. s q5 M: ~: o5 n 如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 5 t& ~* L [* V( P/ V
囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: : y! @: J& D4 d V
若对方沉默、背叛会让我获释,所以会选择背叛。
5 E; V! P4 E; j+ x* }- \: u1 S" X7 ^ 若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
9 N( i' Z7 _- ^. i3 w9 U 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 6 O9 o+ l2 z! |7 o, |/ V
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 # k8 U: v# K9 d1 @) n' h. V
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
. e2 { U/ K9 ~7 s+ a8 [% p$ S/ n[编辑本段]二、智猪博弈理论
# S5 E! A! @8 I% o 智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 % `( D+ [. ^( w7 v1 `3 W; l
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
5 B% F. V6 k- H2 _+ r$ F+ c1 Z* D 猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 6 c0 V5 h! `8 U% h3 g5 F9 d7 `
问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 7 X% V9 ], v" F7 Y
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
6 s# T0 M: G' {& v/ Y8 T7 Q 利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 9 f; L8 e" x7 n) U0 |
现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。# H. d" D2 g% T+ c. C: N
) M" w5 {- h% [$ v. K5 o d8 S
三、关于企业价格策略/ Z- q2 ~& `5 b, r5 f
+ e- D4 a& B+ r1 W" {
9 a( ?% V6 N, t% }$ p 我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
7 U2 J8 C+ A% n7 C$ m 这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略 全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" p4 `3 l3 L8 C2 o4 H( H 以下三个定义:
: I$ M- _1 e! N6 t& B 所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
+ t6 F! d [& U' B4 }0 ^ 所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。
$ X& C" X3 O6 x7 o 所谓的双方优势策略则是指双方利益总和最大的策略。 * H) I/ f- d$ N- s( l4 X! x$ j& ?. l
[编辑本段]严格优势策略举例分析
( B+ M9 q1 x- f/ @, m, E 一、经典的囚徒困境 # b3 a' ^) U3 Q- p& b5 O
1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 P3 _! |: W5 g. X* p( r* j3 [ b! B 警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
. l3 Y8 J5 ?. |% i" G) U' c$ N$ @ 若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 # x) s2 D' d3 H# h, V
若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
( i! ~; I1 A8 [7 n& x 若二人都互相检举(互相“背叛”),则二人同样判监2年。
' o3 _$ f# c0 ~+ m" Z w7 J+ u
( F% Q# ]3 t4 d- O用表格概述如下:5 m5 T6 H$ y$ L) h( W1 X
" h" S8 t; Y' @( W/ P- q
甲沉默(合作) 甲认罪(背叛)
6 ?9 B2 E, t! u. b; L乙沉默(合作) 二人同服刑半年 甲即时获释;乙服刑10年 * v5 t! r0 @- P7 M+ T; F' ?6 C
乙认罪(背叛) 甲服刑10年;乙即时获释 二人同服刑2年 & O7 S: T$ `' Q- F6 ~. e
) X4 J# _& p5 i9 u" c+ a/ @6 g1 P
如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
0 R7 f, T! f' B0 t& K5 t$ { 囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 V: A+ m1 \/ l+ e! v: j V
若对方沉默、背叛会让我获释,所以会选择背叛。 6 \& d+ n- G! \% E+ ]% F
若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
5 I0 p2 U9 M2 u" R2 U6 t$ B' o 二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 5 H& F6 W7 S( M# f
这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 : X% Q7 C, `( ^/ R, `3 R! p
在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
1 h8 v/ V+ E8 x) a+ q9 L9 U[编辑本段]二、智猪博弈理论 D) W: e7 g) n/ _- K
智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 5 Z" G" O4 t6 q) V8 b
该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ' L2 X* c/ u& i8 f
猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
2 `1 Q, m/ Y8 @- p: b" c 问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 ; ~! g4 n4 N; d
“笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 2 v& x0 F# b. e6 K
利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
5 a% u+ l7 D8 e& ? 现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
8 v8 P- x7 e0 O1 S1 b* ] S
; L! E3 H# m$ W; `+ v三、关于企业价格策略
1 ^. }# O5 T9 v, \4 H: J
) i6 a" m, B3 V7 G n3 a7 C' J" h7 b 6 |6 x( `* W% \) T9 c' \
我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 0 T% ` Q4 C! ~
这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局 |