2024年3月11日發(fā)(作者:關(guān)于人的作文)

中微補(bǔ)充講義(9)
關(guān)于廣延性博弈的幾個(gè)問題
一、 完美信息的廣延性博弈轉(zhuǎn)化為策略性博弈應(yīng)注意的幾個(gè)問題
1. 策略與行動(dòng)計(jì)劃
在廣延性博弈里,如果參與人的信息集不止一個(gè),則其策略就會成為一整套計(jì)劃,參與
人必須考慮到當(dāng)自己處于什么“站”應(yīng)當(dāng)用什么應(yīng)對計(jì)劃的問題。這樣,“策略”與“計(jì)劃”
就有了區(qū)別:“計(jì)劃”是指參與人在某個(gè)信息集上選取的行動(dòng);而“策略”是在每個(gè)信息集
上只選取一個(gè)計(jì)劃的前提下,由各個(gè)信息集下所選取的一個(gè)一個(gè)行動(dòng)計(jì)劃構(gòu)成的。
2. 一個(gè)策略所含的計(jì)劃個(gè)數(shù)與策略集所含的策略個(gè)數(shù)
為什么當(dāng)完美信息的廣延型博弈轉(zhuǎn)化為策略性博弈時(shí),有時(shí)策略所包含的計(jì)劃個(gè)數(shù)不止
一個(gè)?原因就在于參與人在廣延型博弈里的信息集不止一個(gè)。參與人i的一個(gè)策略
s
ij
(
j?1,2,...J
,其中
J
為i各用的策略個(gè)數(shù))所含的行計(jì)劃的個(gè)數(shù)等于參與人i擁有的信息
集個(gè)數(shù)。i擁有n個(gè)信息集,其每一個(gè)策略便有n元。請看下例:
在圖11.1里,參與人“1”便有兩個(gè)信息集:一個(gè)數(shù)在博弈的初始點(diǎn),用空心表示;另
一個(gè)信息集是在“1”走了C,參與人“2”走了E之后,又輪到“1”決策的那個(gè)信息集。
這里,由于信息是完美的,從而參與人“1”的每個(gè)信息集都只含有一個(gè)決策點(diǎn)。因此,在
該博弈里,參與人1有兩個(gè)信息集,而參與人2則只有1個(gè)信息集。
1
C
2
(2,0)
E
1
G H
(0,0)
F
(3,1)
D
(1,2)
圖11.1 參與人1擁有兩個(gè)信息集的廣延型博弈
這樣,參與人2的每一個(gè)“策略”就只包含一元。即只含有一個(gè)行動(dòng)計(jì)劃,當(dāng)“2”決
策時(shí),
s
2
或者是“E”,或者是“F”。但參與人1的每個(gè)策略都必須只含有二元:即必須表
示參與人1在博弈開始點(diǎn)的行動(dòng)計(jì)劃與當(dāng)參與人2行動(dòng)之后再由參與人1所做出的反應(yīng)計(jì)
劃。這樣,參與人1的策略就會是(C,G),(C,H),(D,G),(D,H)這樣的構(gòu)成方式,其每
個(gè)策略都是一套計(jì)劃,而不是只含有一個(gè)計(jì)劃。
那么,參與人i在信息完美的廣延型博弈里的策略個(gè)數(shù)是怎么決定的呢?設(shè)具有K個(gè)信
K
息集,在第k個(gè)信息集參與人i擁有
n
k
個(gè)行動(dòng)計(jì)劃,則i策略集中策略個(gè)數(shù)為
?
n
k
,這里,
k?1
K
?
k?1
是連乘號。在上例中,參與人1有兩個(gè)信息集,且其在每個(gè)信息集都擁有兩個(gè)行動(dòng)計(jì)
劃,從而,他有四個(gè)策略:(C,G),(C,H),(D,G),(D,H)。
3. 納什均衡的精煉程度
把圖11.1所表示的廣延型博弈轉(zhuǎn)化為策略型博弈,便有表11.2:
E
參
與
人
1
(C,G)
(C,H)
(D,G)
(D,H)
1,2
0,0
2,0
2,0
表11.2 與圖11.1所對應(yīng)的策略型博弈
表11.2里有兩個(gè)納什均衡:一個(gè)是參與人1選D,這樣無論參與人選2選E或F,無
論參與人1在第二次做決策時(shí)是選G還是選H,都不會改變支付水平(2,0)。另一個(gè)納什
均衡是((C,H),F(xiàn)),即參與人2用選F來結(jié)束博弈。但是,這后一個(gè)納什均衡,如果按
“反向歸納”法,是會被排除掉的。之所以要排除掉這后一個(gè)納什均衡,是由于一旦參與人
2處于自己主動(dòng)采取行動(dòng)的決策點(diǎn),他的“理性”要求他選E,因“2”知道若我選“E”,
則“1”會選G。下一章我們會詳細(xì)講“子博弈完美性”,就是分析每個(gè)決策人在每個(gè)信息集
上都要講理性,都要找出在每個(gè)信息集上的納什均衡。而按這個(gè)原則,表11.2中的((C,
H),F(xiàn))就不再是納什均衡了。
因此,當(dāng)我們把完美信息的廣延型博弈轉(zhuǎn)化為策略型博弈時(shí),所帶來的問題是,這種轉(zhuǎn)
化會導(dǎo)致經(jīng)不起仔細(xì)推敲的納什均衡,即不夠精煉的納什均衡。
參與人2
F
3,1
3,1
2,0
2,0
二、 信息完美的子博弈完美納什均衡舉例
1
C
D
2
F G H
2
I J
E
2
K
(3,0) (1,0) (1,1) (2,1) (2,2) (1,3)
圖12.3 先行者在某些子博弈中有多個(gè)最優(yōu)行動(dòng)的廣延型博弈
在圖12.3中,長度(歷史長度)為1的子博弈有3個(gè),即由參與人2選擇行動(dòng)的3個(gè)
子博弈。長度為2的子博弈有1個(gè),就是原博弈本身。
我們來討論該例的子博弈完美性:
由于歷史
(?,E)
之后的子博弈(最右邊的那個(gè)子博弈)中,參與人2的最優(yōu)行動(dòng)是K,
而在另外兩個(gè)子博弈里,“2”的行動(dòng)選擇不會影響其本人的支付水平,從而,按理性原則(利
己但不損人),參與人2的最優(yōu)策略應(yīng)該有4個(gè):FHK,F(xiàn)IK,GHK,GIK。注意,參與人2
的每個(gè)策略都有3元,因他有三個(gè)信息集。
下面討論對參與人1來說,什么是他的最優(yōu)策略?
對于參與人2的最優(yōu)策略FHK與FIK來說,“C”是參與人1的最優(yōu)策略;
對于參與人2的最優(yōu)策略GHK來說,則無論是C,還是D,還是E,均是參與人1的
最優(yōu)反應(yīng);對于參與人2的最優(yōu)策略GIK來說,參與人1的最優(yōu)策略是D。由參與人2與
參與人1之間的最優(yōu)策略組成的,滿足在每個(gè)子博弈都達(dá)到納什均衡要求的“子博弈完美的
納什均衡”便有6個(gè):(C,(FHK)),(C,(FIK)),(C,(GHK)),(D,(GHK)),(E,(GHK))
與(D,(GIK))。
如果我們把符合子博弈完美性要求的行動(dòng)路徑用黑線標(biāo)出來,以上六個(gè)子博弈完美納什
均衡的均衡路徑為下圖:
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(1)
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(3)
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(5)
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(2)
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(4)
1
C
D
E
2 2 2
F G H I J K
((((((
311221
,,,,,,
001123
))))
))
圖12.4(6)
本文發(fā)布于:2024-03-11 23:35:56,感謝您對本站的認(rèn)可!
本文鏈接:http://m.newhan.cn/zhishi/a/1710171356157731.html
版權(quán)聲明:本站內(nèi)容均來自互聯(lián)網(wǎng),僅供演示用,請勿用于商業(yè)和其他非法用途。如果侵犯了您的權(quán)益請與我們聯(lián)系,我們將在24小時(shí)內(nèi)刪除。
本文word下載地址:關(guān)于廣延性博弈.doc
本文 PDF 下載地址:關(guān)于廣延性博弈.pdf
| 留言與評論(共有 0 條評論) |