
《博弈論》習題
一、
單項選擇題
1.博弈論中,局中人從一個博弈中得到的結果常被稱為( )。
A. 效用 B. 支付
C. 決策 D. 利潤
2.博弈中通常包括下面的內容,除了( )。
A.局中人 B.占優戰略均衡
C.策略 D.支付
3.在具有占優戰略均衡的囚徒困境博弈中( )。
A.只有一個囚徒會坦白 B.兩個囚徒都沒有坦白
C.兩個囚徒都會坦白 D.任何坦白都被法庭否決了
4.在多次重復的雙頭博弈中,每一個博弈者努力( )。
A.使行業的總利潤達到最大 B.使另一個博弈者的利潤最小
C.使其市場份額最大 D.使其利潤最大
5.一個博弈中,直接決定局中人支付的因素是( )。
A. 策略組合 B. 策略
C. 信息 D. 行動
6.對博弈中的每一個博弈者而言,無論對手作何選擇,其總是擁有惟一最佳行為,此時的博弈具有( )。
A.囚徒困境式的均衡 B.一報還一報的均衡
C.占優策略均衡 D.激發戰略均衡
7.如果另一個博弈者在前一期合作,博弈者就在現期合作;但如果另一個博弈者在前一期違約,博弈者在
現期也違約的策略稱為( )。
A.一報還一報的策略 B.激發策略
C.雙頭策略 D.主導企業策略
8.在囚徒困境的博弈中,合作策略會導致( )。
A.博弈雙方都獲勝 B.博弈雙方都失敗
C.使得先采取行動者獲勝 D.使得后采取行動者獲勝
9.在什么時候,囚徒困境式博弈均衡最可能實現( )。
A. 當一個壟斷競爭行業是由一個主導企業控制時
B.當一個寡頭行業面對的是重復博弈時
C.當一個壟斷行業被迫重復地與一個寡頭行業博弈時
D. 當一個寡頭行業進行一次博弈時
10.一個企業采取的行為與另一個企業在前一階段采取的行為一致,這種策略是一種( )。
A.主導策略 B.激發策略
C.一報還一報策略 D.主導策略
11.關于策略式博弈,正確的說法是( )。
A. 策略式博弈無法刻劃動態博弈
B. 策略式博弈無法表明行動順序
C. 策略式博弈更容易求解
D. 策略式博弈就是一個支付矩陣
12.下列關于策略的敘述哪個是錯誤的( ):
A. 策略是局中人選擇的一套行動計劃;
B. 參與博弈的每一個局中人都有若干個策略;
C. 一個局中人在原博弈中的策略和在子博弈中的策略是相同的;
D. 策略與行動是兩個不同的概念,策略是行動的規則,而不是行動本身。
13. 囚徒困境說明( ):
A. 雙方都獨立依照自己的利益行事,則雙方不能得到最好的結果;
B. 如果沒有某種約束,局中人也可在(抵賴,抵賴)的基礎上達到均衡;
C. 雙方都依照自己的利益行事,結果一方贏,一方輸;
D、每個局中人在做決策時,不需考慮對手的反應
14. 一個博弈中,直接決定局中人損益的因素是( ):
A. 策略組合 B. 策略
C. 信息 D. 行動
15. 動態博弈參與者在關于博弈過程的信息方面是( )
A 不對稱的 B 對稱的
C 不確定的 D 無序的
16. 古諾模型體現了寡頭企業的( )決策模型。
A 成本 B 價格
C 產量 D 質量
17.伯特蘭德模型體現了寡頭企業( )決策模型。
A 成本 B 價格
C 產量 D 質量
18. 用囚徒困境來說明兩個寡頭企業的情況,說明了:( )
A、每個企業在做決策時,不需考慮競爭對手的反應
B、一個企業制定的價格對其它企業沒有影響
C、企業為了避免最差的結果,將不能得到更好的結果
D、一個企業制定的產量對其它企業的產量沒有影響
19. 子博弈精煉納什均衡( ):
A. 是一個一般意義上的納什均衡;
B. 和納什均衡沒有什么關系;
C. 要求某一策略組合在每一個子博弈上都構成一個納什均衡;
D. 要求某一策略組合在原博弈上都構成一個納什均衡。
20. 在一般產品銷售市場上,以下哪種原因導致了逆向選擇。 ( )
A 產品質量的不確定性 B 私人信息
C 公共信息 D 產品價格
21. 完全信息動態博弈參與者的行動是( )
A 無序的 B 有先后順序的
C 不確定的 D 因環境改變的
22. 市場交易中普遍存在的討價還價屬于哪種博弈。( )
A 完全信息靜態博弈 B 完全信息動態博弈
C 不完全信息靜態博弈 D不完全信息動態博弈
23.下面哪種模型是一種動態的寡頭市場博弈模型( )
A 古諾模型 B 伯川德模型
C 斯塔克爾伯格模型 D田忌齊威王賽馬
24.博弈方根據一組選定的概率,在兩種或兩種以上可能行為中隨機選擇的策略為( )
A 純策略 B 混合策略
C 激發策略 D一報還一報策略
25.影響重復博弈均衡結果的主要因素是( )
A 博弈重復的次數 B 信息的完備性
C 支付的大小 D A和B
26.在動態博弈戰略行動中,只有當局中人從實施某一威脅所能獲得的總收益( )不實施該威脅所獲得的
總收益時,該威脅才是可信的。
A 大于 B 等于
C 小于 D 以上都有可能
二、判斷正誤并簡要說明理由
1. 納什均衡一定是上策均衡,上策均衡一定是納什均衡。
2.在一個博弈中博弈方可以有很多個。
3. 在一個博弈中只可能存在一個納什均衡。
4. 因為零和博弈中博弈方之間關系都是競爭性的、對立的,因此零和博弈就是非合作博弈。
5. 在一個博弈中如果存在多個納什均衡則不存在上策均衡。
6.由于兩個罪犯只打算犯罪一次,所以被捕后才出現了不合作的問題即囚徒困境。但如果他們打算重復合伙多
次,比如說20次,那么對策論預測他們將采取彼此合作的態度,即誰都不招供。
7. 在博弈中納什均衡是博弈雙方能獲得的最好結果。
8. 在博弈中如果某博弈方改變策略后得益增加則另一博弈方得益減少。
9. 納什均衡即任一博弈方單獨改變策略都只能得到更小利益的策略組合。
10. 囚徒的困境博弈中兩個囚徒之所以會處于困境,無法得到較理想的結果,是因為兩囚徒都不在乎坐牢時間長
短本身,只在乎不能比對方坐牢的時間更長。
11. 斯塔克博格產量領導者所獲得的利潤的下限是古諾均衡下它得到的利潤。
12.在有限次重復博弈中,存在最后一次重復正是破壞重復博弈中局中人利益和行為的相互制約關系,使重復博
弈無法實現更高效率均衡的關鍵問題。
13. 子博弈精煉納什均衡不是一個納什均衡。
14. 零和博弈的無限次重復博弈中,可能發生合作,局中人不一定會一直重復原博弈的混合戰略納什均衡。
15.原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰略組合,符合各局中人最大利益:采用原博弈的純戰
略納什均衡本身是各局中人能實現的最好結果,符合所有局中人的利益,因此,不管是重復有限次還是無限
次,不會和一次性博弈有區別。
16.在動態博弈中,因為后行動的博弈方可以先觀察對方行為后再選擇行為,因此總是有利的。
三、計算與分析題
1、A、B兩企業利用廣告進行競爭。若A、B兩企業都做廣告,在未來銷售中,A企業可以獲得20萬元利潤,B
企業可獲得8萬元利潤;若A企業做廣告,B 企業不做廣告,A企業可獲得25萬元利潤,B企業可獲得2萬
元利潤;若A企業不做廣告,B企業做廣告,A企業可獲得10萬元利潤,B企業可獲得12萬元利潤;若A、B
兩企業都不做廣告,A企業可獲得30萬元利潤,B企業可獲得6萬元利潤。
(1)畫出A、B兩企業的損益矩陣。
(2)求純策略納什均衡。
2、可口可樂與百事可樂(參與者)的價格決策:雙方都可以保持價格不變或者提高價格(策略);博弈的目標和
得失情況體現為利潤的多少(收益); 利潤的大小取決于雙方的策略組合(收益函數); 博弈有四種策略組
合,其結局是:
(1)雙方都不漲價,各得利潤10單位;
(2)可口可樂不漲價,百事可樂漲價,可口可樂利潤100,百事可樂利潤-30;
(3)可口可樂漲價,百事可樂不漲價,可口可樂利潤-20,百事可樂利潤30;
(4)雙方都漲價,可口可樂利潤140,百事可樂利潤35;
畫出兩企業的損益矩陣求納什均衡。
3、假定某博弈的報酬矩陣如下:
乙
左 右
甲 上 a,b c,d
下 e,f g,h
(1)如果(上,左)是上策均衡,那么,a>?, b>?, g<?, f>?
(2)如果(上,左)是納什均衡,上述哪幾個不等式必須滿足?
4、 北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的市場。如果它們合作,各獲得500000元
的壟斷利潤,但不受限制的競爭會使每一方的利潤降至60000元。如果一方在價格決策方面選擇合作而另一方卻
選擇降低價格,則合作的廠商獲利將為零,競爭廠商將獲利900000元。
(1)將這一市場用囚徒困境的博弈加以表示。
(2)解釋為什么均衡結果可能是兩家公司都選擇競爭性策略。
5、博弈的收益矩陣如下表:
乙
左 右
上 a,b c,d
甲
下 e,f g,h
(1)如果(上,左)是占優策略均衡,則a、b、c、d、e、f、g、h之間必然滿足哪些關系?(盡量把所有
必要的關系式都寫出來)
(2)如果(上,左)是納什均衡,則(1)中的關系式哪些必須滿足?
(3)如果(上,左)是上策均衡,那么它是否必定是納什均衡?為什么?
(4)在什么情況下,純策略納什均衡不存在?
6、豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個飼料槽,另一頭裝有控制飼料供應的按鈕。按一下按鈕就
會有10個單位飼料進槽,但誰按誰就要付出2個單位的成本。誰去按按紐則誰后到;都去按則同時到。若大豬
先到,大豬吃到9個單位,小豬吃到一個單位;若同時到,大豬吃7個單位,小豬吃3個單位;若小豬先到,大
豬吃六個單位,小豬吃4個單位。求(1)各種情況組合扣除成本后的支付矩陣
(2)求納什均衡。
7、設啤酒市場上有兩家廠商,各自選擇是生產高價啤酒還是低價啤酒,相應的利潤(單位:萬元)由下圖的得
益矩陣給出:
乙
低價 高價
低價 100,800 50,50
甲
高價 -20,-30 900,600
(1)有哪些結果是納什均衡?
(2)兩廠商合作的結果是什么?
8、求出下列博弈的所有純策略納什均衡。
局中人2
甲 乙 丙 丁
局中人1 A 2,3 3,2 3,4 0,3
B 4,4 5,2 0,1 1,2
C 3,1 4,1 1,4 10,2
D 3,1 4,1 -1,2 10,1
9、求出下面博弈的納什均衡(含純策略和混合策略)。
乙
L R
U 5,0 0,8
甲
D 2,6 4,5
10、根據兩人博弈的損益矩陣回答問題:
乙
左 右
上 2,3 0,0
甲
下 0,0 4,2
(1)寫出兩人各自的全部策略。
(2)找出該博弈的全部純策略納什均衡。
(3)求出該博弈的混合策略納什均衡。
11、某寡頭壟斷市場上有兩個廠商,總成本均為自身產量的20倍, 市場需求函
數為Q=200-P。
求:(1)若兩個廠商同時決定產量,產量分別是多少?
(2)若兩個廠商達成協議壟斷市場,共同安排產量,則各自的利潤情況如何?
(3)用該案例解釋囚徒困境。
2
C?20Q
11
,。12、假設雙頭壟斷企業的成本函數分別為:,市場需求曲線為,其中,
C?2QQ?Q?Q
212
2
P?400?2Q
(1)求出古諾(Cournot)均衡情況下的產量、價格和利潤,求出各自的反應函數,并圖示均衡點。
(2)求出斯塔克博格(Stackelberg)均衡情況下的產量、價格和利潤。
(3)說明導致上述兩種均衡結果差異的原因。
13.下面的得益矩陣兩博弈方之間的一個靜態博弈,該博弈有沒有純策略的納什均衡,博弈的結果是什么?
14. 兩個兄弟分一塊冰激凌。哥哥先提出一個分割比例,弟弟可以接受或拒絕,接受則按哥哥的提議分割,若拒
絕就自己提出一個比例。但這時候冰激凌已化得只剩1/2了,對弟弟提議的比例哥哥也可以接受或拒絕,若
接受則按弟弟的建議分割,若拒絕冰激凌會全部化光。因為兄弟之間不應該做損人不利己的是,因此我們假
設接受和拒絕利益相同時兄弟倆都會接受。求該博弈的子博弈完美納什均衡。
15.如果學生在考試之前全面復習,考好的概率為90%,如果學生只復習一部分重點,則有50%的概率考好。全面
復習花費的時間t1=100 小時,重點復習之需要花費t2=20 小時。學生的效用函數為:U=W-2e,其中W是考
試成績,有高低兩種分數Wh和Wl,e為努力學習的時間。問老師如何才能促使學生全面復習?
16.在下列監工與工人之間的博弈中,試用劃線法分析該博弈有無純策略納什均衡;如果沒有,那么寫出混合策
略納什均衡的結果。
監工
監督 不監督
工人 偷懶 1,-1 -1,2
不偷懶 -2,3 2,2
17.求解下列博弈的納什均衡。
博弈方2
左 中 右
博弈方1 上 4,3 5,1 6,2
中 2,1 8,4 3,6
下 3,0 12,6 2,9
18.某人正在打一場官司,不請律師肯定會輸,請律師后的結果與律師的努力程度有關。假設當律師努力工作(100
小時)時有50%的概率能贏,律師不努力工作(10小時)則只有15%的概率能贏。如果訴訟獲勝可得到250
萬元賠償,失敗則沒有賠償。因為委托方無法監督律師的工作,因此雙方約定根據結果付費,贏官司律師可
獲賠償金額的10%,失敗則律師一分錢也得不到。如果律師的效用函數為,其中是報酬,
.m?0.05e
m
e
是努力小時數,且律師有機會成本5萬元。求這個博弈的均衡。
四、論述題
1、解釋“囚犯困境”,并舉商業案例說明。
2、用“小偷與守衛的博弈”說明“激勵(監管)悖論”。
《博弈論》習題參考答案
一、單項選擇題
1~5 B. B. C. D. A. 6~10 C. A. A. D. C.
11~15. B. C. A. A. C. 16~20 C. B. C. C. B.
21~26. B. B. C. B. D. A.
二、判斷正誤并簡要說明理由
1、F 上策均衡是比納什均衡更嚴格的均衡。所以上策均衡一定是納什均衡,而納什均衡不一定是上策均衡,
2、T 博弈類型按局中人數多少分為單人博弈、雙人博弈和多人博弈
3.F 博弈雙方偏好存在差異的條件下,一個博弈模型中可能存在多個納什均衡,如性別戰。
4.T 零和博弈指參與博弈各方在嚴格競爭下,一方收益等于另一方損失,博弈各方收益與損失之和恒為零,所
以雙方不存在合作可能性
5.T 上策均衡是通過嚴格下策消去法(重復剔除下策)所得到的占優策略,只能有一個納什均衡
6.F 只要兩囚犯只打算合作有限次,其最優策略均為招供。比如最后一次合謀,兩小偷被抓住了,因為將來沒
有合作機會了,最優策略均為招供。回退到倒數第二次,既然已經知道下次不會合作,這次為什么要合作呢。
依此類推,對于有限次內的任何一次,兩小偷均不可能合作。
7.F 納什均衡是上策的集合,指在給定的別人策略情況下,博弈方總是選擇利益相對較大的策略,并不保證
結果是最好的。
8.F 局中人總是以自己的利益最大化選擇自己的策略,并不以對方收益的變化為目標
9.T 納什均衡是上策的集合,指在給定的別人策略情況下,沒有人會改變自己的策略而減低自己的收益
10.F 局中人總是以自己的利益最大化選擇自己的策略,并不以對方收益的變化為目標
11.T 雖然斯塔格伯格模型各方利潤總和小于古諾模型,但是領導者的利潤比古諾模型時高
12. .T無限次重復博弈沒有結束重復的確定時間;而在有限次重復博弈中,存在最后一次重復,并且正是有結束
重復的確定時間,使重復博弈無法實現更高效率均衡。
13. F 子博弈精煉納什均衡一定是一個納什均衡。
14.F零和博弈的無限次重復博弈中,所有階段都不可能發生合作,局中人會一直重復原博弈的混合戰略納什均衡。
15.T 原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰略組合,因此不管是重復有限次還是無限次,不會
和一次性博弈有區別。
16.F 動態博弈是指各博弈方的選擇和行動又先后次序的博弈。動態博弈的信息可以是不對稱的。所以策略分為
先發制人和。斯塔克伯格博弈揭示“先發制人”更有利,而“后發制人”-----后行動的博弈方可以先觀
察對方行為后再選擇行為反而處于不利境地。
三、計算與分析題
1、(1)
B
做廣告不做廣告
A
做廣告
不
做廣告
20,8 25,2
10,12 30,6
(2)純策略納什均衡為(做廣告,做廣告),(做廣告,做廣告)。
不不
2、
百事可樂
不漲價漲價
100,-30 10,10
140,35 -20,30
可口可樂不漲價
漲價
納什均衡(不漲價,不漲價),(漲價,漲價)。從帕累托均衡角度,為(漲價,漲價)
3、 (1)如果(上,左)是上策均衡,那么,a>e b>d, g
(2)如果(上,左)是納什均衡,a>e b>d,不等式必須滿足
4、
新華航空
合作競爭
0,90 北方航空合作50,50
6,6 競爭90,0
5、略
6、
小豬
按 等
按 5,1 4,4
大豬
等 9,-1 0,0
納什均衡為(按,等)。
7、略
8、純策略納什均衡(B,甲),(A,丙)
9、
乙
甲
L R
U 5,0 0,8
D 2,6 4,5
(1)不存在純策略納什均衡
(2)設甲選擇“U”的概率為P1,則選擇“D”的概率為1-P1
乙選擇“L”的概率為P2,則選擇“R”的概率為1-P2
對甲而言,最佳策略是按一定的概率選“上”和“下”,使乙選擇“左”和“右”的期望值相等
即 P1*8+(1-P1)*0= P1*1+(1-P1)*5
解得 P1=5/12
即(5/12,7/12)按5/12概率選“上”、7/12概率選“下”為甲的混合策略Nash均衡
對乙而言,最佳策略是按一定的概率選“左”和“右”,使乙選擇“上”和“下”的期望值相等
即 P2*5+(1-P2)*0= P2*2+(1-P2)*4
解得 P2=4/7
即(4/7,3/7)按4/7概率選“左”、3/7概率選“右”為乙的混合策略Nash均衡
10、略。
11、見筆記
12、見筆記。
13.
首先,運用嚴格下策反復消去法的思想,不難發現在博弈方1的策略中,B是相對于T的嚴格下策。把
博弈方1的B策略消去后又可以發現,博弈方2的策略中C是相對于R的嚴格下策,從而也可以消去。
兩個博弈方各消去一個策略后的博弈是如下的兩人2×2博弈,已經不存在任何嚴格下策。再運用劃線
或箭頭法,很容易發現這個2×2博弈有兩個純策略納什均衡(M,L)和(T,R)。
由于兩個純策略納什均衡之間沒有帕累托效率意義上的優劣關系,一次性靜態博弈的結果不能肯定。由
于雙方在該博弈中可能采取混合策略,因此實際上該博弈的結果可以是4個純策略組合中的任何一個。
14.
假設哥的方案是S1:1-S1,其中S1是自己的份額,弟的方案是S2:1-S2,S2是哥的份額,那么可用如
下的擴展形表示該博弈:
運用逆推歸納法先分析最后一階段哥的選擇。由于只要接受的利益不少于不接受的利益哥就會接受,
因此在這個階段只要弟的方案滿足S2/2≥0,也就是S2≥0,哥就會接受,否則不會接受。由于冰激凌的份
額不可能是負數,也就是說因為哥不接受弟的方案冰激凌會全部化掉,因此任何方案哥都會接受。
現在回到前一階段弟的選擇。由于弟知道后一階段哥的選擇方法,因此知道如果不接受前一階段哥提
出的比例,自己可以取S2=0,獨享此時還未化掉的1/2塊冰激凌;如果選擇接受前一階段哥的提議,那么
自己將得到1-S1,顯然只要1-S1≥1/2,即S1≤1/2,弟就會接受哥的提議。
再回到第一階段哥的選擇。哥清楚后兩個階段雙方的選擇邏輯和結果,因此他在這一階段選擇S1=1/2,
正是能夠被弟接受的自己的最大限度份額,超過這個份額將什么都不能得到,因此S1=1/2是最佳選擇。
綜上,該博弈的子博弈完美納什均衡是:哥哥開始時就提議按(1/2,1/2)分割,弟弟接受。
15. 本題中老師的調控手段高分和低分的差距。該博弈的擴展形如下:
學生選擇全面復習的期望得益是U1=0.9(Wh-200)+ 0.1 (Wl-200 )
重點復習的期望得益是U2=0.5(Wh-40)+ 0.5(Wl-40 )
只有當U1》U2時學生才會選擇全面復習。根據U1》U2我們可以算出Wh- Wl》400。這就是老師能有
效全面復習需要滿足的條件。其實在獎學金與成績掛鉤時,Wh- Wl也可以理解成不同等獎學金的差額。
16.
沒有純策略均衡,只有混合策略均衡((0.25,0.75),(0.5,0.5))
17.可以根據畫線法求得有唯一純策略均衡(上,左)
18.參見第15題
四、論述題
1、解釋“囚犯困境”,并舉商業案例說明。
(1)假設條件舉例:兩囚徒被指控是一宗罪案的同案犯。他們被分別關在不同的牢房無法互通信息。各囚徒都
被要求坦白罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,兩囚徒可以期望被從輕發
落入獄2年;如果一個囚徒坦白而另一個囚徒不坦白,坦白的這個囚徒就只需入獄1年,而不坦白的囚徒
將被判入獄10年。
(2)囚徒困境的策略矩陣表。每個囚徒都有兩種策略:坦白或不坦白。表中的數字分別代表囚徒甲和乙的得益。
囚徒乙
坦白 不坦白
囚徒甲 坦白 -5,-5 -1, -10
-2, -2 不坦白 -10,-1
(3)分析:通過劃線法可知:在囚徒困境這個模型中,納什均衡就是雙方都“坦白”。給定甲坦白的情況下,乙
的最優策略是坦白;給定乙坦白的情況下,甲的最優策略也是坦白。這里雙方都坦白不僅是納什均衡,而且
是一個上策均衡,即不論對方如何選擇,個人的最優選擇是坦白。其結果是雙方都坦白。
(4)商業案例:寡頭壟斷廠商經常發現它們自己處于一種囚徒的困境。當寡頭廠商選擇產量時,如果寡頭廠商
們聯合起來形成卡特爾,選擇壟斷利潤最大化產量,每個廠商都可以得到更多的利潤。但卡特爾協定不是
一個納什均衡,因為給定雙方遵守協議的情況下,每個廠商都想增加生產,結果是每個廠商都只得到納什
均衡產量的利潤,它遠小于卡特爾產量下的利潤。
2、用“小偷與守衛的博弈”說明“激勵(監管)悖論”。
(1)假設條件舉例:偷竊和防止偷竊是小偷和門衛之間進行博弈的一場游戲。門衛可以不睡覺,或者睡覺。小
偷可以采取偷、不偷兩種策略。如果小偷知道門衛睡覺,他的最佳選擇就是偷;如果門衛不睡覺,他最好
還是不偷。對于門衛,如果他知道小偷想偷,他的最佳選擇是不睡覺,如果小偷采取不偷,自己最好去睡
覺。
(2)小偷與門衛的支付矩陣表(假定小偷在門衛睡覺時一定偷成功,在門衛不睡覺時偷一定會被抓住):
門衛
睡覺 不睡覺
小偷 偷 1,-1
-2, 0
不偷
0, 2 0, 0
(3)分析:通過劃線法可知:這個博弈是沒有納什均衡的。門衛不睡覺,小偷不偷,雙方都沒有收益也沒有損
失;門衛不睡覺,小偷偷,門衛因為是本職工作得不到獎勵,小偷被判刑喪失效用2單位;門衛睡覺,小
偷不偷,門衛睡覺的很愉快得到效用2單位,小偷沒有收益也沒有損失;門衛睡覺,小偷偷,門衛因失職
被處分而喪失效用1單位,小偷偷竊成功獲得效用1單位。
(4)“激勵(監管)悖論”說明:現實中,我們看到,當門衛不睡覺時,偷竊分子便收斂一陣;嚴打的時期一過,
偷竊分子又開始興風作浪,在不能容忍小偷過分猖狂的時候,門衛不得不再次開始認真。即偷的小偷越多,
那么不睡覺的門衛將會越多,偷的小偷越少,不睡覺的門衛將越少;反過來,不睡覺的門衛越多,偷的小
偷就越少,不睡覺的門衛越少,偷的小偷就越多。如果偷竊集團傾巢出動,那么門衛的選擇也是全部不睡
覺,但門衛一旦全部不睡覺,小偷最好選擇全部不偷,小偷一旦選擇全部不偷,門衛最好全部選擇睡覺。
(5)結論:加重對小偷的處罰在長期中并不能抑制偷竊(而只能使門衛偷懶);加重處罰失職門衛恰恰是會降低
偷竊發生的概率。這種門衛和小偷的博弈所揭示的,政策目標和政策結果之間的這種意外關系,常被稱為
“激勵的悖論”。

本文發布于:2023-11-10 09:43:42,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/169958062286789.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:“博弈論”習題及參考答案.doc
本文 PDF 下載地址:“博弈論”習題及參考答案.pdf
| 留言與評論(共有 0 條評論) |