首頁 > 專欄

博弈論復習題及答案

更新時間:2023-11-10 07:25:35 閱讀：評論：0

不動產管理-認識自己作文

2023年11月10日發(fā)(作者：美麗河湖)

博弈論

判斷題（每小題1分，共15分）

囚徒困境說明個人的理性選擇不一定是集體的理性選擇。（√ ）

子博弈精煉納什均衡不是一個納什均衡。（× ）

衡。（√ ）

多個純戰(zhàn)略納什均衡博弈的有限次重復博弈子博弈完美納什均衡路徑：

兩階段都采用原博弈同一個純戰(zhàn)略納什均衡，或者輪流采用不同純戰(zhàn)略

納什均衡，或者兩次都采用混合戰(zhàn)略納什均衡，或者混合戰(zhàn)略和純戰(zhàn)略

分）

參與人(player)

即各博弈方同時決策，且所有博弈方對各方得益都了解的博弈。

上策：

不管其它博弈方選擇什么策略，一博弈方的某個策略給他帶來的得

益始終高于其它的策略，至少不低于其他策略的策略

上策均衡：

一個博弈的某個策略組合中的所有策略都是各個博弈方各自的上策，

必然是該博弈比較穩(wěn)定的結果

嚴格下策：

階段博弈

重復博弈中的每次博弈稱為“階段博弈”。

貼現因子

下一期的一單位支付在這一期的價值。

觸發(fā)戰(zhàn)略（Trigger Strategy）

首先試探合作，一旦發(fā)現對方不合作，則也用不合作相報

復的戰(zhàn)略。

子博弈精煉納什均衡

（夫妻博弈）一對新婚夫妻為晚上看什么電視節(jié)目爭執(zhí)不下，丈夫

（記為I方）要看足球比賽節(jié)目，而妻子（記為Ⅱ方）要看戲曲節(jié)目.他

求納什均衡。

博弈的穩(wěn)定狀態(tài)有兩個：都不漲價或者都漲價（均衡），均衡稱為博弈

的解。

3、豬圈里有一頭大豬和一頭小豬，豬圈的一頭有一個飼料槽，另一頭

裝有控制飼料供應的按鈕。按一下按鈕就會有10個單位飼料進槽，但誰

按誰就要付出2個單位的成本。誰去按按紐則誰后到；都去按則同時

到。若大豬先到，大豬吃到9個單位，小豬吃到一個單位；若同時到，

大豬吃7個單位，小豬吃3個單位；若小豬先到，大豬吃六個單位，小豬

吃4個單位。各種情況組合扣除成本后的支付矩陣可如下表示（每格第

一個數字是大豬的得益，第二個數字是小豬的得益）：

小豬

按等待

(2)Pure NE (A, a); (B, b)

都是Pareto有效，僅(B, b)是Ｋ－Ｈ有效。

(3)Mixed NE ((2/5, 3/5); (2/3, 1/3))

5、用反應函數法求出下列博弈的所有純戰(zhàn)略納什均衡。

參與人

bacd

2,33,23,40,3

4,45,20,11,2

3,14,11,410,2

3,14,1-1,210,1

B參與

人1

解答：

者）選擇是否與新企業(yè)展開競爭。在位者可能有兩種類型，溫柔型（左

圖）和殘酷型（右圖），回答下面問題。

進入者

在位者

進入

不進入

默許

斗爭

（20，30）

（-10，0）

（0，100）

進入者

在位者

進入

不進入

默許

斗爭

（-10，25）

（0，100）

（10，20）

9、北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的

市場。如果它們合作，各獲得500000元的壟斷利潤，但不受限制的競爭

會使每一方的利潤降至60000元。如果一方在價格決策方面選擇合作而

另一方卻選擇降低價格，則合作的廠商獲利將為零，競爭廠商將獲利

900000元。

（1）將這一市場用囚徒困境的博弈加以表示。

（2）解釋為什么均衡結果可能是兩家公司都選擇競爭性策略。

答：（1）用囚徒困境的博弈表示如下表：

北方航空公司

合作競爭

新華航空公司

合作500000，5000000，900000

售中，A企業(yè)可以獲得20萬元利潤，B企業(yè)可獲得8萬元利潤；若A企業(yè)做

廣告，B企業(yè)不做廣告，A企業(yè)可獲得25萬元利潤，B企業(yè)可獲得2萬元利

潤；若A企業(yè)不做廣告，B企業(yè)做廣告，A企業(yè)可獲得10萬元利潤，B企業(yè)

可獲得12萬元利潤；若A、B兩企業(yè)都不做廣告，A企業(yè)可獲得30萬元利

潤，B企業(yè)可獲得6萬元利潤。

（1）畫出A、B兩企業(yè)的支付矩陣。

（2）求納什均衡。

3. 答：（1）由題目中所提供的信息，可畫出A、B兩企業(yè)的支付矩

陣（如下表）。

B企業(yè)

做廣告不做廣告

A企業(yè)

做廣告20，825，2

不做廣告10，1230，6

（2）因為這是一個簡單的完全信息靜態(tài)博弈，對于純策納什均衡

解可運用劃橫線法求解。

如果A廠商做廣告，則B廠商的最優(yōu)選擇是做廣告，因為做廣告所獲

得的利潤8大于不做廣告獲得的利潤2，故在8下面劃一橫線。如果A廠商

由劃線法易知，該矩陣博弈沒有純策略Nash均衡。

可得如下不等式組

Q=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1

可得混合策略Nash均衡((),()

16、某產品市場上有兩個廠商，各自都可以選擇高質量，還是低質

量。相應的利潤由如下得益矩陣給出：

(1) 該博弈是否存在納什均衡？如果存在的話，哪些結果是納什均衡?

參考答案：

由劃線法可知，該矩陣博弈有兩個純策略Nash均衡，即(低質量, 高質

量)， (高質量,低質量)。

乙企業(yè)

高質量低質量

50,50100,800質

甲

企

業(yè)

發(fā)

解：用劃線法找出問題的純策略納什均衡點。

所以可知該問題有兩個純策略納什均衡點(開發(fā),不開發(fā))和(不開發(fā),開

發(fā))。

該博弈還有一個混合的納什均衡((),())。

如果乙企業(yè)所在國政府對企業(yè)開發(fā)新產品補貼a個單位,則收益矩陣變

為：,要使(不開發(fā),開發(fā))成為該博弈的唯一納什均衡點,只需a>10。此

時乙企業(yè)的收益為100+a。

18、博弈的收益矩陣如下表：

（1）列出收益矩陣。

（2）如果參與者以1/3的概率選擇每一個數字，證明該混合策略存

在一個納什均衡，它為多少？

答：（1）此博弈的收益矩陣如下表。該博弈是零和博弈，無納什

均衡。

John

123

13，-3-1，1-1，1

Smith2-1，13，-3-1，1

3-1，1-1，13，-3

對壟斷企業(yè)2來說：

這是壟斷企業(yè)2的反應函數。

其等利潤曲線為：

在達到均衡時，有：

均衡時的價格為：

兩壟斷企業(yè)的利潤分別為：

均衡點可圖示為：

企業(yè)1

200

190

企業(yè)2

企業(yè)1的反應線

均衡點

（2）當壟斷企業(yè)1為領導者時，企業(yè)2視企業(yè)1的產量為既定，其反

應函數為：

則企業(yè)1的問題可簡化為：

均衡時價格為：

利潤為：，

答：該博弈分為兩個階段，第一階段企業(yè)1選擇產量q，第二階段企業(yè)2

和3觀測到q后，他們之間作一完全信息的靜態(tài)博弈。我們按照逆向遞

歸法對博弈進行求解。

（1）假設企業(yè)1已選定產量q，先進行第二階段的計算。設企業(yè)2，3的

利潤函數分別為：

由于兩企業(yè)均要追求利潤最大，故對以上兩式分別求一階條件：

（1）

（2）

求解（1）、（2）組成的方程組有：

（3）

（2）現進行第一階段的博弈分析：

對與企業(yè)1，其利潤函數為；

將（3）代入可得：

（4）

式（4）對q求導：

益矩陣或擴展形表示

該博弈并作簡單分析。

（2）如果老板無法看出工人是否偷懶，博弈屬于哪種類型？用得益矩

陣或擴展形表示該博

弈并作簡單分析。

（1）完全信息動態(tài)博弈。

前進停下

甲

2，0前進-2，-2

0，0停下0，2

28、給定兩家釀酒企業(yè)A、B的收益矩陣如下表：

A企業(yè)

白酒啤酒

B企業(yè)

白酒700，600900，1000

啤酒800，900600，800

（2）分析混合策略納什均衡。

答：（1）該博弈的支付矩陣如下表：

納稅人

逃稅不逃稅

稅收機關

檢查A-C+F， -A-FA-C，-A

不檢查0，0A，-A

（2）先分析稅收檢查邊際：因為S為稅務機關檢查的概率，E為納

32、簡要評論博弈論在微觀經濟學運用中的優(yōu)缺點。

答：博弈論是描述和研究行為者之間策略相互依存和相互作用的一

種決策理論。它被廣泛應用于政治、外交、軍事、經濟等研究領域，但

在微觀經濟學中的應用是最成功的。博弈論的研究方法和特征與經濟學

結合得非常緊密。它強調個人理性，即在給定的約束條件下追求效用最

大化。但博弈論又比傳統的經濟學更進一步，它研究的不是面臨非人格

化的價格參數下的決策問題，而是研究效用隨各個主體的行為改變而改

變的效用最大化問題。除了國際貿易、金融、拍賣等經濟領域，博弈論

在企業(yè)理論特別是寡頭競爭研究方法方面做了大量的有益工作。

20世紀80年代以來，博弈論開始出現在西方經濟學的教科書中，都

解釋并討論此例的納斯均衡，為什么其均衡是一種囚徒困境。

廠商1的總收益TR由下式給出：

廠商1的邊際收益MR為：

MR=30-2Q-Q

112

利用利潤最大化條件MR=MC=0，得廠商1的反應函數(reaction

function)或反應曲線為：

Q=15-0.5Q (6-1)

同理可得廠商2的反應曲線為：

Q=15-0.5Q (6-2)

均衡產量水平就是兩反應曲線交點Q和Q的值，即方程組6-1和6-2的

解。可以求得古諾均衡時的均衡產量水平為：Q=Q=10。

因此，在本例中，兩個寡頭的總產量Q為Q+Q=20，均衡價格為P=30-

Q=10。

剛才我們討論了兩寡頭廠商相互競爭時的均衡產量。現在我們放松

第(6)條不能串謀的假設，假定兩寡頭可以串謀。它們能共同確定產量

以使總利潤最大化。

這時，兩廠商的總收益TR為：

TR=PQ=(30-Q)Q=30Q-Q

其邊際收益MR為：

MR=30-2Q

根據利潤最大化條件MR=MC=0，可以求得當Q=15時總利潤最大。如果兩

廠商同意平分利潤，每個寡頭廠商將各生產總產量的一半，即

Q=Q=7.5。其實，任何相加為15的產量Q和Q的組合都使總利潤最大

1212

化，因此，把Q+Q=15稱為契約曲線，而Q=Q=7.5是契約曲線上的一個

1212

點。

我們還可以求得當價格等于邊際成本時，Q=Q=15，各廠商的利潤為

零。

35、兩家電視臺競爭周末黃金時段晚8點到10點的收視率，可選擇把較

好的節(jié)目放在前面還是后面。他們決策的不同組合導致收視率如下：

(1)如果兩家是同時決策，有納什均衡嗎?

有（前面，后面）

(2)如果雙方采用規(guī)避風險的策略，均衡的結果是什么?

(4)如果兩家談判合作，電視臺1許諾將好節(jié)目放在前面，這許諾可信

嗎？結果能是什么？

電視臺1 許諾將好節(jié)目放在前面的許諾不可信。

因為電視臺2，前面為占優(yōu)策略，

而在電視臺2 ，選擇前面的時候，電視臺1 選擇后面的收益要大于前面

的收益。

所以，最終結果為（前面，后面）

36、如果將如下的囚徒困境博弈重復進行無窮次，懲罰機制為觸發(fā)策

略，貼現因子為δ。試問δ應滿足什么條件，才存在子博弈完美納什均

衡？

乙坦不坦

甲白白

坦白4,40,5

不坦5,01,1

白

P=a-Q

TR=P*Q=(a-Q)*Q

MR=a-2Q

因為：MR=MC

a-2Q=c

則:Q=(a-c)/2

P=(a+c)/2

π=(P-c)*Q=(a-c)2/4

每家企業(yè)的利潤為(a-c)2/4n

（2）假設A企業(yè)自主降價，雖然只是微小的價格調整，但足以占領整個

試求 (a)該廠商的AC,MC及VMP各為多少?

LLL

(b)勞動工資為多少?廠商會雇用多少勞動?

由：S=D解得：W=280

由于產品市場為完全競爭市場，且要素市場也為完全競爭市場

所以，滿足：產品市場均衡：P=MR=MC=W/MP

要素市場均衡：W= AC=MC=VMP

LLL

得到：AC=MC=VMP=280

LLL

由：D=S解得：P= 40，q=10

廠商追求利潤最大化的情況下：

W*=VMPL=P*MPL=P*50/L

0.5

L*=[100/2*PW*]=51 (取整數)

論述題（每小題20分，共20分）

解釋“囚犯困境”，并舉商業(yè)案例說明。

囚徒困境是博弈論里最著名的例子之一，幾乎所有的博弈論著作中

都要討論這個例子。這個例子是這樣的：兩囚徒被指控是一宗罪案的同

案犯。他們被分別關在不同的牢房無法互通信息。各囚徒都被要求坦白

罪行。如果兩囚徒都坦白，各將被判入獄5年；如果兩人都不坦白，則

很難對他們提起刑事訴訟，因而兩囚徒可以期望被從輕發(fā)落入獄2年；

另一方面，如果一個囚徒坦白而另一個囚徒不坦白，坦白的這個囚徒就

只需入獄1年，而不坦白的囚徒將被判入獄10年。表6-2給出了囚徒困境

的策略式表述。這里，每個囚徒都有兩種策略：坦白或不坦白。表中的

數字分別代表囚徒甲和乙的得益。(注意，這里的得益是負值。)

表6-2 囚徒困境

囚徒乙

坦白不坦白

囚徒甲

坦白-5， -5-1，

不坦白-10，-2， -2

-10

情況下，乙的最優(yōu)策略是坦白；給定乙坦白的情況下，甲的最優(yōu)策略也

是坦白。而且這里雙方都坦白不僅是納什均衡，而且是一個上策

(dominant strategy)均衡，即不論對方如何選擇，個人的最優(yōu)選擇是

坦白。因為如果乙不坦白，甲坦白的話就被輕判1年，不坦白的話就判2

年，坦白比不坦白要好；如果乙坦白，甲坦白的話判5年，不坦白的話

判10年，所以，坦白仍然比不坦白要好。這樣，坦白就是甲的上策，當

然也是乙的上策。其結果是雙方都坦白。這個組合是納什均衡。

寡頭壟斷廠商經常發(fā)現它們自己處于一種囚徒的困境。當寡頭廠商

選擇產量時，如果寡頭廠商們聯合起來形成卡特爾，選擇壟斷利潤最大

化產量，每個廠商都可以得到更多的利潤。但卡特爾協定不是一個納什

均衡，因為給定雙方遵守協議的情況下，每個廠商都想增加生產，結果

是每個廠商都只得到納什均衡產量的利潤，它遠小于卡特爾產量下的利

潤。

解釋“智豬博弈(boxed pigs)”，并舉商業(yè)案例說明。

市場中的大企業(yè)與小企業(yè)之間的關系類似智豬博弈。大企業(yè)進行研

究與開發(fā)，為新產品做廣告，而對小企業(yè)來說這些工作可能得不償失。

所以，小企業(yè)可能把精力花在模仿上，或等待大企業(yè)用廣告打開市場后

再出售廉價產品。

解釋““夫妻博弈”(battle of the xes)”，并舉商業(yè)案例說

明。

“夫妻博弈”(battle of the xes)的例子講的是一對談戀愛的男

女安排業(yè)余活動，他們有二種選擇，或去看足球比賽，或去看芭蕾舞演

出。男方偏好足球，女方偏好芭蕾，但他們寧愿在一起，不愿分開。表

6-6給出了這個博弈的得益矩陣。在這個博弈中，如果雙方同時決定，

則有兩個納什均衡，即都去看足球比賽和都去看芭蕾演出。但是到底最

后他們去看足球比賽還是去看芭蕾演出，并不能從中獲得結論。如果假

設這是個序列博弈，例如，當女方先作出選擇看芭蕾演出時，男方只能

選擇芭蕾；當女方先選擇了看足球比賽時，男方也只能選擇足球。反

比如在美國汽車產業(yè)發(fā)展史中的某些階段，通用汽車就扮演

過這種領導者的角色(這一例子把模型直接擴展到允許不止一

個追隨企業(yè)，如福特、克萊斯勒等等)。根據斯塔克爾貝里的

假定，模型中的企業(yè)選擇其產量，這一點和古諾模型是一致

的(只不過古諾模型中企業(yè)是同時行動的，不同于這里的序貫

行動)。

這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。

對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價：

回顧在古諾博弈的納什均衡中，每一企業(yè)的產量為(a一

c)/3,也就是說，斯塔克爾貝里博弈中逆向歸納解的總產量

3(a-c)/4，比古諾博弈中納什均衡的總產量2(a-c)/3要高，

，其中R (L)為企業(yè)雇傭L名工人可以取得的收入(在最優(yōu)

的生產和產品市場決策下)，假定R (L)是增函數，并且為凹

函數。

L保持不變，w降低時企業(yè)的利潤就會提高，于是較低的等利

表現在圖中的無差異曲線上就是，工會希望選擇一個工資水

平w，由此得到的結果(w， L*(w))處于可能達到的最高的無

差異線上。這一最優(yōu)化間題的解為w*，這樣一個工資要求將

使得工會通過(w*， L*(w*))的無差異曲線與L*(w)相切于該

從一個長期來看，兩者的均衡將維持在警察以0.33的概率巡邏犯罪者以

0.4的概率作案上面?，F實中，我們看到，當嚴打的時候（警察出擊的

落魄的意思-深候

本文發(fā)布于:2023-11-10 07:25:35，感謝您對本站的認可！

本文鏈接：http://m.newhan.cn/zhishi/a/1699572335211389.html

本文word下載地址：博弈論復習題及答案.doc

本文 PDF 下載地址：博弈論復習題及答案.pdf

上一篇：日本與中美戰(zhàn)略競爭——貿易戰(zhàn)、科技戰(zhàn)及印太戰(zhàn)略

下一篇：返回列表

標簽：零和競爭

2023-11-10競爭與合作范式
2023-11-10日本與中美戰(zhàn)略競爭——貿易戰(zhàn)、科技戰(zhàn)及印太戰(zhàn)略
2023-11-10什么是零和博弈零和博弈的意義
2023-11-10[零和思維是什么意思]零和思維:零和思維
2023-11-10零和博弈與合作共贏演講稿
2023-11-10海爾集團競爭戰(zhàn)略
2023-11-10中美科技競爭
2023-11-10零和博弈
2023-11-10零和博弈是什么
2023-11-10零和博弈通俗理解

留言與評論（共有 0 條評論）