
博 弈 論
判斷題(每小題1分,共15分)
囚徒困境說明個人的理性選擇不一定是集體的理性選擇。(√ )
子博弈精煉納什均衡不是一個納什均衡。(× )
衡。(√ )
多個純戰(zhàn)略納什均衡博弈的有限次重復博弈子博弈完美納什均衡路徑:
兩階段都采用原博弈同一個純戰(zhàn)略納什均衡,或者輪流采用不同純戰(zhàn)略
納什均衡,或者兩次都采用混合戰(zhàn)略納什均衡,或者混合戰(zhàn)略和純戰(zhàn)略
分)
參與人(player)
即各博弈方同時決策,且所有博弈方對各方得益都了解的博弈。
上策:
不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來的得
益始終高于其它的策略,至少不低于其他策略的策略
上策均衡:
一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策,
必然是該博弈比較穩(wěn)定的結果
嚴格下策:
階段博弈
重復博弈中的每次博弈稱為“階段博弈”。
貼現因子
下一期的一單位支付在這一期的價值。
觸發(fā)戰(zhàn)略(Trigger Strategy)
首先試探合作,一旦發(fā)現對方不合作,則也用不合作相報
復的戰(zhàn)略。
子博弈精煉納什均衡
(夫妻博弈) 一對新婚夫妻為晚上看什么電視節(jié)目爭執(zhí)不下,丈夫
(記為I方)要看足球比賽節(jié)目,而妻子(記為Ⅱ方)要看戲曲節(jié)目.他
求納什均衡。
博弈的穩(wěn)定狀態(tài)有兩個:都不漲價或者都漲價(均衡),均衡稱為博弈
的解。
3、豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個飼料槽,另一頭
裝有控制飼料供應的按鈕。按一下按鈕就會有10個單位飼料進槽,但誰
按誰就要付出2個單位的成本。誰去按按紐則誰后到;都去按則同時
到。若大豬先到,大豬吃到9個單位,小豬吃到一個單位;若同時到,
大豬吃7個單位,小豬吃3個單位;若小豬先到,大豬吃六個單位,小豬
吃4個單位。各種情況組合扣除成本后的支付矩陣可如下表示(每格第
一個數字是大豬的得益,第二個數字是小豬的得益):
小豬
按 等待
(2)Pure NE (A, a); (B, b)
都是Pareto有效,僅(B, b)是K-H有效。
(3)Mixed NE ((2/5, 3/5); (2/3, 1/3))
5、用反應函數法求出下列博弈的所有純戰(zhàn)略納什均衡。
參與人
2
bacd
2,33,23,40,3
4,45,20,11,2
3,14,11,410,2
3,14,1-1,210,1
A
B參與
C
D
人1
解答:
者)選擇是否與新企業(yè)展開競爭。在位者可能有兩種類型,溫柔型(左
圖)和殘酷型(右圖),回答下面問題。
.
進入者
在位者
進入
不進入
默許
斗爭
(20,30)
(-10,0)
(0,100)
進入者
在位者
進入
不進入
默許
斗爭
(-10,25)
(0,100)
(10,20)
9、北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的
市場。如果它們合作,各獲得500000元的壟斷利潤,但不受限制的競爭
會使每一方的利潤降至60000元。如果一方在價格決策方面選擇合作而
另一方卻選擇降低價格,則合作的廠商獲利將為零,競爭廠商將獲利
900000元。
(1)將這一市場用囚徒困境的博弈加以表示。
(2)解釋為什么均衡結果可能是兩家公司都選擇競爭性策略。
答:(1)用囚徒困境的博弈表示如下表:
北方航空公司
合作競爭
新華航空公司
合作500000,5000000,900000
售中,A企業(yè)可以獲得20萬元利潤,B企業(yè)可獲得8萬元利潤;若A企業(yè)做
廣告,B企業(yè)不做廣告,A企業(yè)可獲得25萬元利潤,B企業(yè)可獲得2萬元利
潤;若A企業(yè)不做廣告,B企業(yè)做廣告,A企業(yè)可獲得10萬元利潤,B企業(yè)
可獲得12萬元利潤;若A、B兩企業(yè)都不做廣告,A企業(yè)可獲得30萬元利
潤,B企業(yè)可獲得6萬元利潤。
(1)畫出A、B兩企業(yè)的支付矩陣。
(2)求納什均衡。
3. 答:(1)由題目中所提供的信息,可畫出A、B兩企業(yè)的支付矩
陣(如下表)。
B企業(yè)
做廣告不做廣告
A企業(yè)
做廣告20,825,2
不做廣告10,1230,6
(2)因為這是一個簡單的完全信息靜態(tài)博弈,對于純策納什均衡
解可運用劃橫線法求解。
如果A廠商做廣告,則B廠商的最優(yōu)選擇是做廣告,因為做廣告所獲
得的利潤8大于不做廣告獲得的利潤2,故在8下面劃一橫線。如果A廠商
由劃線法易知,該矩陣博弈沒有純策略Nash均衡。
可得如下不等式組
Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1
可得混合策略Nash均衡((),()
16、 某產品市場上有兩個廠商,各自都可以選擇高質量,還是低質
量。相應的利潤由如下得益矩陣給出:
(1) 該博弈是否存在納什均衡?如果存在的話,哪些結果是納什均衡?
參考答案:
由劃線法可知,該矩陣博弈有兩個純策略Nash均衡,即(低質量, 高質
量), (高質量,低質量)。
乙企業(yè)
高質量低質量
50,50100,800質
甲
企
業(yè)
發(fā)
解:用劃線法找出問題的純策略納什均衡點。
所以可知該問題有兩個純策略納什均衡點(開發(fā),不開發(fā))和(不開發(fā),開
發(fā))。
該博弈還有一個混合的納什均衡((),())。
如果乙企業(yè)所在國政府對企業(yè)開發(fā)新產品補貼a個單位,則收益矩陣變
為:,要使(不開發(fā),開發(fā))成為該博弈的唯一納什均衡點,只需a>10。此
時乙企業(yè)的收益為100+a。
18、博弈的收益矩陣如下表:
(1)列出收益矩陣。
(2)如果參與者以1/3的概率選擇每一個數字,證明該混合策略存
在一個納什均衡,它為多少?
答:(1)此博弈的收益矩陣如下表。該博弈是零和博弈,無納什
均衡。
John
123
13,-3-1,1-1,1
Smith2-1,13,-3-1,1
3-1,1-1,13,-3
對壟斷企業(yè)2來說:
這是壟斷企業(yè)2的反應函數。
其等利潤曲線為:
在達到均衡時,有:
均衡時的價格為:
兩壟斷企業(yè)的利潤分別為:
均衡點可圖示為:
0
企業(yè)1
95
200
190
企業(yè)2
企業(yè)1的反應線
均衡點
(2)當壟斷企業(yè)1為領導者時,企業(yè)2視企業(yè)1的產量為既定,其反
應函數為:
則企業(yè)1的問題可簡化為:
均衡時價格為:
利潤為:,
答:該博弈分為兩個階段,第一階段企業(yè)1選擇產量q,第二階段企業(yè)2
1
和3觀測到q后,他們之間作一完全信息的靜態(tài)博弈。我們按照逆向遞
1
歸法對博弈進行求解。
(1)假設企業(yè)1已選定產量q,先進行第二階段的計算。設企業(yè)2,3的
1
利潤函數分別為:
由于兩企業(yè)均要追求利潤最大,故對以上兩式分別求一階條件:
(1)
(2)
求解(1)、(2)組成的方程組有:
(3)
(2)現進行第一階段的博弈分析:
對與企業(yè)1,其利潤函數為;
將(3)代入可得:
(4)
式(4)對q求導:
1
益矩陣或擴展形表示
該博弈并作簡單分析。
(2)如果老板無法看出工人是否偷懶,博弈屬于哪種類型?用得益矩
陣或擴展形表示該博
弈并作簡單分析。
(1)完全信息動態(tài)博弈。
前進停下
甲
2,0前進-2,-2
0,0停下0,2
28、給定兩家釀酒企業(yè)A、B的收益矩陣如下表:
A企業(yè)
白酒啤酒
B企業(yè)
白酒700,600900,1000
啤酒800,900600,800
(2)分析混合策略納什均衡。
答:(1)該博弈的支付矩陣如下表:
納稅人
逃稅不逃稅
稅收機關
檢查A-C+F, -A-FA-C,-A
不檢查0,0A,-A
(2)先分析稅收檢查邊際:因為S為稅務機關檢查的概率,E為納
32、簡要評論博弈論在微觀經濟學運用中的優(yōu)缺點。
答:博弈論是描述和研究行為者之間策略相互依存和相互作用的一
種決策理論。它被廣泛應用于政治、外交、軍事、經濟等研究領域,但
在微觀經濟學中的應用是最成功的。博弈論的研究方法和特征與經濟學
結合得非常緊密。它強調個人理性,即在給定的約束條件下追求效用最
大化。但博弈論又比傳統的經濟學更進一步,它研究的不是面臨非人格
化的價格參數下的決策問題,而是研究效用隨各個主體的行為改變而改
變的效用最大化問題。除了國際貿易、金融、拍賣等經濟領域,博弈論
在企業(yè)理論特別是寡頭競爭研究方法方面做了大量的有益工作。
20世紀80年代以來,博弈論開始出現在西方經濟學的教科書中,都
解釋并討論此例的納斯均衡,為什么其均衡是一種囚徒困境。
廠商1的總收益TR由下式給出:
1
廠商1的邊際收益MR為:
1
MR=30-2Q-Q
112
利用利潤最大化條件MR=MC=0,得廠商1的反應函數(reaction
11
function)或反應曲線為:
Q=15-0.5Q (6-1)
12
同理可得廠商2的反應曲線為:
Q=15-0.5Q (6-2)
21
均衡產量水平就是兩反應曲線交點Q和Q的值,即方程組6-1和6-2的
12
解。可以求得古諾均衡時的均衡產量水平為:Q=Q=10。
12
因此,在本例中,兩個寡頭的總產量Q為Q+Q=20,均衡價格為P=30-
12
Q=10。
剛才我們討論了兩寡頭廠商相互競爭時的均衡產量。現在我們放松
第(6)條不能串謀的假設,假定兩寡頭可以串謀。它們能共同確定產量
以使總利潤最大化。
這時,兩廠商的總收益TR為:
TR=PQ=(30-Q)Q=30Q-Q
2
其邊際收益MR為:
MR=30-2Q
根據利潤最大化條件MR=MC=0,可以求得當Q=15時總利潤最大。如果兩
廠商同意平分利潤,每個寡頭廠商將各生產總產量的一半,即
Q=Q=7.5。其實,任何相加為15的產量Q和Q的組合都使總利潤最大
1212
化,因此,把Q+Q=15稱為契約曲線,而Q=Q=7.5是契約曲線上的一個
1212
點。
我們還可以求得當價格等于邊際成本時,Q=Q=15,各廠商的利潤為
12
零。
35、兩家電視臺競爭周末黃金時段晚8點到10點的收視率,可選擇把較
好的節(jié)目放在前面還是后面。他們決策的不同組合導致收視率如下:
(1)如果兩家是同時決策,有納什均衡嗎?
有(前面,后面)
(2)如果雙方采用規(guī)避風險的策略,均衡的結果是什么?
(4)如果兩家談判合作,電視臺1許諾將好節(jié)目放在前面,這許諾可信
嗎?結果能是什么?
電視臺1 許諾將好節(jié)目放在前面的許諾不可信。
因為電視臺2,前面為占優(yōu)策略,
而在電視臺2 ,選擇前面的時候,電視臺1 選擇后面的收益要大于前面
的收益。
所以,最終結果為(前面,后面)
36、如果將如下的囚徒困境博弈重復進行無窮次,懲罰機制為觸發(fā)策
略,貼現因子為δ。試問δ應滿足什么條件,才存在子博弈完美納什均
衡?
乙坦不坦
甲白白
坦白4,40,5
不坦5,01,1
白
P=a-Q
TR=P*Q=(a-Q)*Q
MR=a-2Q
因為:MR=MC
a-2Q=c
則:Q=(a-c)/2
P=(a+c)/2
π=(P-c)*Q=(a-c)2/4
每家企業(yè)的利潤為(a-c)2/4n
(2)假設A企業(yè)自主降價,雖然只是微小的價格調整,但足以占領整個
試求 (a)該廠商的AC,MC及VMP各為多少?
LLL
(b)勞動工資為多少?廠商會雇用多少勞動?
由:S=D解得:W=280
LL
由于產品市場為完全競爭市場,且要素市場也為完全競爭市場
所以,滿足:產品市場均衡:P=MR=MC=W/MP
L
要素市場均衡:W= AC=MC=VMP
LLL
得到:AC=MC=VMP=280
LLL
由:D=S解得:P= 40,q=10
廠商追求利潤最大化的情況下:
W*=VMPL=P*MPL=P*50/L
0.5
L*=[100/2*PW*]=51 (取整數)
2
論述題(每小題20分,共20分)
解釋“囚犯困境”,并舉商業(yè)案例說明。
囚徒困境是博弈論里最著名的例子之一,幾乎所有的博弈論著作中
都要討論這個例子。這個例子是這樣的:兩囚徒被指控是一宗罪案的同
案犯。他們被分別關在不同的牢房無法互通信息。各囚徒都被要求坦白
罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,則
很難對他們提起刑事訴訟,因而兩囚徒可以期望被從輕發(fā)落入獄2年;
另一方面,如果一個囚徒坦白而另一個囚徒不坦白,坦白的這個囚徒就
只需入獄1年,而不坦白的囚徒將被判入獄10年。表6-2給出了囚徒困境
的策略式表述。這里,每個囚徒都有兩種策略:坦白或不坦白。表中的
數字分別代表囚徒甲和乙的得益。(注意,這里的得益是負值。)
表6-2 囚徒困境
囚徒乙
坦白不坦白
囚徒甲
坦白-5, -5-1,
不坦白-10,-2, -2
-10
情況下,乙的最優(yōu)策略是坦白;給定乙坦白的情況下,甲的最優(yōu)策略也
是坦白。而且這里雙方都坦白不僅是納什均衡,而且是一個上策
(dominant strategy)均衡,即不論對方如何選擇,個人的最優(yōu)選擇是
坦白。因為如果乙不坦白,甲坦白的話就被輕判1年,不坦白的話就判2
年,坦白比不坦白要好;如果乙坦白,甲坦白的話判5年,不坦白的話
判10年,所以,坦白仍然比不坦白要好。這樣,坦白就是甲的上策,當
然也是乙的上策。其結果是雙方都坦白。這個組合是納什均衡。
寡頭壟斷廠商經常發(fā)現它們自己處于一種囚徒的困境。當寡頭廠商
選擇產量時,如果寡頭廠商們聯合起來形成卡特爾,選擇壟斷利潤最大
化產量,每個廠商都可以得到更多的利潤。但卡特爾協定不是一個納什
均衡,因為給定雙方遵守協議的情況下,每個廠商都想增加生產,結果
是每個廠商都只得到納什均衡產量的利潤,它遠小于卡特爾產量下的利
潤。
解釋“智豬博弈(boxed pigs)”,并舉商業(yè)案例說明。
市場中的大企業(yè)與小企業(yè)之間的關系類似智豬博弈。大企業(yè)進行研
究與開發(fā),為新產品做廣告,而對小企業(yè)來說這些工作可能得不償失。
所以,小企業(yè)可能把精力花在模仿上,或等待大企業(yè)用廣告打開市場后
再出售廉價產品。
解釋““夫妻博弈”(battle of the xes)”,并舉商業(yè)案例說
明。
“夫妻博弈”(battle of the xes)的例子講的是一對談戀愛的男
女安排業(yè)余活動,他們有二種選擇,或去看足球比賽,或去看芭蕾舞演
出。男方偏好足球,女方偏好芭蕾,但他們寧愿在一起,不愿分開。表
6-6給出了這個博弈的得益矩陣。在這個博弈中,如果雙方同時決定,
則有兩個納什均衡,即都去看足球比賽和都去看芭蕾演出。但是到底最
后他們去看足球比賽還是去看芭蕾演出,并不能從中獲得結論。如果假
設這是個序列博弈,例如,當女方先作出選擇看芭蕾演出時,男方只能
選擇芭蕾;當女方先選擇了看足球比賽時,男方也只能選擇足球。反
比如在美國汽車產業(yè)發(fā)展史中的某些階段,通用汽車就扮演
過這種領導者的角色(這一例子把模型直接擴展到允許不止一
個追隨企業(yè),如福特、克萊斯勒等等)。根據斯塔克爾貝里的
假定,模型中的企業(yè)選擇其產量,這一點和古諾模型是一致
的(只不過古諾模型中企業(yè)是同時行動的,不同于這里的序貫
行動)。
這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。
對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價:
回顧在古諾博弈的納什均衡中,每一企業(yè)的產量為(a一
c)/3,也就是說,斯塔克爾貝里博弈中逆向歸納解的總產量
3(a-c)/4,比古諾博弈中納什均衡的總產量2(a-c)/3要高,
,其中R (L)為企業(yè)雇傭L名工人可以取得的收入(在最優(yōu)
的生產和產品市場決策下),假定R (L)是增函數,并且為凹
函數。
L保持不變,w降低時企業(yè)的利潤就會提高,于是較低的等利
表現在圖中的無差異曲線上就是,工會希望選擇一個工資水
平w,由此得到的結果(w, L*(w))處于可能達到的最高的無
差異線上。這一最優(yōu)化間題的解為w*,這樣一個工資要求將
使得工會通過(w*, L*(w*))的無差異曲線與L*(w)相切于該
從一個長期來看,兩者的均衡將維持在警察以0.33的概率巡邏犯罪者以
0.4的概率作案上面?,F實中,我們看到,當嚴打的時候(警察出擊的

本文發(fā)布于:2023-11-10 07:25:35,感謝您對本站的認可!
本文鏈接:http://m.newhan.cn/zhishi/a/1699572335211389.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:博弈論復習題及答案.doc
本文 PDF 下載地址:博弈論復習題及答案.pdf
| 留言與評論(共有 0 條評論) |