《產(chǎn)業(yè)經(jīng)濟學(xué)》第五章(博弈2).ppt
《《產(chǎn)業(yè)經(jīng)濟學(xué)》第五章(博弈2).ppt》由會員分享,可在線閱讀,更多相關(guān)《《產(chǎn)業(yè)經(jīng)濟學(xué)》第五章(博弈2).ppt(46頁珍藏版)》請在裝配圖網(wǎng)上搜索。
第三節(jié)完全但不完美信息動態(tài)博弈一、不完美信息動態(tài)博弈1.概念和例子動態(tài)博弈的基本特征是各個博弈方的行為不是同時,而是有先后次序的。既然各個博弈方不在同一個時刻行為,那么在多數(shù)情況下,后行為的博弈方在自己行為之前都可以觀察到先于自己行為的其他博弈方的行為,也即后面階段選擇的博弈方有關(guān)于前面階段博弈進程的充分信息。這種完全了解自己行為之前博弈進程的博弈方稱為“有完美信息(PerfectInformation)的博弈方”。如果一個動態(tài)博弈中的所有博弈方都是有完美信息的,我們就稱這種博弈為“完美信息的動態(tài)博弈”。,但是,由于博弈方可能會故意保密或信息傳遞不暢等原因,動態(tài)博弈中也可能存在至少部分后行為的博弈方,無法了解在自己之前行為的部分或全部博弈方行為的情況。我們稱它們?yōu)椤安煌昝佬畔⒌膭討B(tài)博弈”,相應(yīng)的博弈方則稱為“有不完美信息的博弈方”。本節(jié)所討論的不完美信息動態(tài)博弈中,各博弈方對博弈結(jié)束時每個博弈方的得益是完全清楚的,因此博弈方是有“完全信息”(CompleteInformation)的,這類博弈我們稱之為“完全但不完美信息動態(tài)博弈”,或簡稱“不完美信息動態(tài)博弈”。,(1)二手車博弈不完美信息動態(tài)博弈的基本特征之一是博弈方之間在信息方面的不對稱性。以關(guān)于二手車的博弈問題為例。如果你在二手車市場上買了一輛二手車,則你過后常會發(fā)覺合算、不合算,或占了大便宜、吃了大虧等等,而買一輛新車則這種感覺相對較少。之所以買二手車后常會發(fā)覺價值與原先估計的有距離,主要原因是你作為買方在二手車交易中信息較少。而賣方對車子的真實情況和價值比買方具有多得多的了解。,我們把這個二手車交易抽象成這樣一個博弈問題:先是原車主(即賣方)選擇如何使用車子。為了簡單起見,我們假設(shè)有好、差兩種方式,分別對應(yīng)二手車市場上內(nèi)在質(zhì)量好、差兩種情況的二手車;第二階段是原車主作為賣方?jīng)Q定是否要賣,賣價可以只有一種、有高低兩種或更多,價格越多當(dāng)然問題就越復(fù)雜;最后是買方?jīng)Q定是否買下,我們假設(shè)買方要么接受賣方價格,要么不買,但不能討價還價。,由于在這個動態(tài)博弈中,買方作為一個博弈方對第一階段賣方的行為不了解,即買方具有不完美信息,這是一個不完美信息的動態(tài)博弈。值得注意的是本博弈中第一階段賣方對車子的選擇,嚴(yán)格講起來是在這個二手車交易發(fā)生之前早就存在的,是在買賣雙方考慮這個交易之前就已經(jīng)確定了的,只是買方不清楚而已,因此嚴(yán)格意義上講,它并不構(gòu)成本博弈的一個階段。這種將早已存在、確定或者非主動性的選擇引進動態(tài)博弈作為一個階段,并用對該階段情況了解程度的差異反映博弈中不完美信息的方法是一種常用的處理方法。,(2)市場進入博弈在前面討論過的市場進入博弈中,給定在位者和進入者各種策略組合下的得益,假設(shè)進入者先行動,最后均衡結(jié)果是進入者進入,在位者默許。這個博弈中,雙方的得益都是共同的知識,即信息是完全的,但現(xiàn)實中的企業(yè)進入和遏制是沒有那么簡單的,其博弈往往滿足不了完美信息的要求。事實上,當(dāng)一個企業(yè)要想進入某個市場時,它并不清楚已在市場上的企業(yè)的實際成本函數(shù),也就不知道其得益即具體盈利情況。故潛在進入者只能根據(jù)市場上大家都能觀察到的一些信息,如在位者的定價來對在位企業(yè)的類型(是高成本的還是低成本的或者兩者的可能概率多大等)作一個大致的判斷,幫助自己決策。,市場進入的簡單博弈:潛在進入者要決定是否進入一個新的產(chǎn)業(yè),但不知道在位者的成本函數(shù),只知道在位者有兩種可能的成本函數(shù),即高成本或低成本,對應(yīng)兩種成本情況的不同策略組合的得益矩陣如下表:在位者高成本情況低成本情況默許打擊默許打擊進進入40,50-10,030,80-10,100入者不進入0,3000,3000,4000,400表5-7不完全信息情況市場進入博弈的得益矩陣,,,,,,,在此例中,進入者有關(guān)在位者的成本信息是不完美的,但在位者知道進入者的有關(guān)成本信息,即信息是不對稱的。從上表可以看出,如果在位者是高成本的,給定進入者進入,在位者的最優(yōu)選擇是默許;而如果在位者是低成本的,由得益矩陣可以看出,給定進入者進入,在位者的最優(yōu)選擇是打擊,故最后的均衡結(jié)果是進入者不進入,在位者打擊。因此如果是在完全信息的情況下,知道在位者是高成本則進入者進入;知道在位者是低成本,則進入者就不進入。,但現(xiàn)在因為進入者并不知道在位者究竟是高成本還是低成本,進入者的最優(yōu)選擇只能依賴于他的判斷,即在多大程度上認(rèn)為在位者是高成本的或低成本的。假定進入者認(rèn)為在位者是高成本的概率為P,低成本的概率為(1-P),那么進入者選擇進入的期望利潤是P(40)+(1-P)(-10),選擇不進入的期望利潤是0。所以只有當(dāng)進入者的期望利潤大于不進入的期望利潤時,即P(40)+(1-P)(-10)≥0,或者P≥1/5時才選擇進入;如果P<1/5則不進入?,F(xiàn)實中的市場進入與遏制基本就是這樣,一般要用不完美信息博弈來分析。,從這個例子我們可以看出,在不完美信息情況下的博弈參與人的最優(yōu)策略不僅僅依賴于其他參與人的策略,更依賴于他對其他參與人情況的判斷。如上述例子中,當(dāng)進入者判斷在位者高成本的概率P<1/5時,他的最優(yōu)策略是不進入;而當(dāng)他判斷在位者高成本的概率P≥1/5時,則最優(yōu)策略是進入。這實際上就是完全但不完美信息博弈的標(biāo)準(zhǔn)分析方法,在對其他參與人的各種可能類型出現(xiàn)概率的大小做出判斷,然后根據(jù)該判斷計算自己各種策略在其他參與人這種類型的分布下能給自己帶來的期望得益,找出其中最大期望得益對應(yīng)的策略就是己方的最優(yōu)策略。,2.不完美信息動態(tài)博弈的擴展式表示以前面介紹過的二手車交易為例,我們可用圖5.11來表示這個不完美信息博弈問題。圖5.11中最上面一個節(jié)點表示第一階段賣方(記博弈方1)對如何使用汽車的選擇,共有“好”和“差”兩種可能的選擇。賣方對自己的這個選擇當(dāng)然是清楚的,因此第二階段他選擇“賣”還是“不賣”時,是根據(jù)兩種不同情況的針對性選擇。在第一階段為“好”的情況下,賣方第二階段可以選擇“賣”或“不賣”,在第一階段為“差”的情況下,同樣也可以選擇“賣”或“不賣”。如果他選擇的是“不賣”,則不管第一階段是“好”是“差”,博弈都告結(jié)束,雙方都既無損失也無得利。,如果他選擇的是“賣”,則博弈進行到第三階段,輪到買方進行選擇。我們是假設(shè)買方無法知道第一階段賣方的選擇的,因此在第二階段賣方選擇賣的情況下,買方無法知道賣方前兩階段的路徑究竟是“好——賣”還是“差——賣”,因此他無法分別作針對性的選擇。我們把兩個代表前面階段博弈(就是賣方的選擇)不同路徑的節(jié)點放在一個信息集中,表示買方在該決策階段的信息不完美性。這同樣意味著雖然買方在此處只有“買”、“不買”兩種選擇,但可能的結(jié)果卻有四種,包括“買”到好車、差車,“不買”好車、差車。前兩種結(jié)果對買方、賣方都有差異,而后兩種結(jié)果則最多只對賣方有差異。,設(shè)使用好時對買方而言該車值3千元,使用差時值1千元,賣方要價2千元(可理解為買方想買的檔次)。再假設(shè)使用差時賣方需要花費1千元才能將車子偽裝成使用良好。那么,如果用凈收益(收益減成本)作為賣方的得益,用消費者剩余(價值減價格)作為買方的得益,則該博弈的雙方得益如圖5-11所示。其中各個得益數(shù)組的第一個數(shù)字為賣方,即博弈方1的得益。我們注意當(dāng)賣方在第二階段選擇賣而買方在第三階段選擇不買時,車況好、差對買方利益毫無影響,都是既無得也無失,但對賣方來講則明顯不同,因為當(dāng)車況差時賣方想賣必須先花代價偽裝,賣不出去就會白白損失這筆費用,即1千元的損失。,1好差11不賣賣(0,0)賣不賣(0,0)22買不買買不買(2,1)(0,0)(1,-1)(-1,0)圖5-11二手車交易擴展式表示,,,,,,,,,,,,,根據(jù)上述得益情況看,買方在賣方選擇賣的前提下,選擇買既有賺的可能(車況好),也有虧的可能(車況差),選擇不買當(dāng)然肯定不會吃虧,但也失去了獲得利益的機會,因此沒有一個選擇絕對比另一個好。對賣方來說,車況好時賣不賣得出去都無損失,只有得益的可能,因此賣總是比不賣好,但當(dāng)車況差時賣得出賣不出卻截然相反,賣得出有所得利,賣不出卻要虧損,因此是否該賣就不那么容易判斷。,要讓賣方在車況差的情況下決定是否賣必須有進一步的信息或判斷,即買方會買下的概率究竟有多大;要讓買方?jīng)Q定是否買還必須要有進一步的信息或判斷,實際上就是在賣方選賣的前提下車況好、車況差各自的概率。因為有了這樣的信息或判斷,買方或賣方就至少能對獲利機會、損失風(fēng)險的大小程度心中有數(shù),在自己承受能力的基礎(chǔ)上做出正確的判斷和選擇。但雙方?jīng)Q策需要的這些信息或判斷又都與雙方的選擇有關(guān),因此在兩個博弈方的選擇、信息和判斷之間就形成了一種復(fù)雜的交互決定關(guān)系。事實上,這種交互決定關(guān)系正是不完美信息動態(tài)博弈的關(guān)鍵和主要研究對象。,二、完美貝葉斯均衡在完全且完美信息動態(tài)博弈中,我們通過要求均衡策略組合滿足子博弈完美性(即策略組合在每個子博弈中都構(gòu)成納什均衡)來保證均衡策略中沒有任何不可信的威脅或承諾,其核心均衡概念就是子博弈精煉(完美)納什均衡。但是,在完全但不完美信息的動態(tài)博弈中,因為存在多節(jié)點信息集,一些重要的選擇及其后續(xù)階段不構(gòu)成真子博弈,因此子博弈完美性要求無法滿足,也就無法完全排除不可信的威脅或承諾,無法保證均衡策略中所有選擇的可信性,子博弈精煉納什均衡的概念失去了意義,因此必須發(fā)展新的均衡概念。,1.完美貝葉斯均衡的定義當(dāng)一個策略組合及相應(yīng)的判斷滿足如下四個要求時,稱為一個“完美貝葉斯均衡”。這些要求是:要求1:在各個信息集,輪到選擇的博弈方必須具有一個關(guān)于博弈達(dá)到該信息集中每個節(jié)點可能性的“判斷”,對非單節(jié)點信息集,一個“判斷”就是博弈達(dá)到該信息集中各個節(jié)點可能性的概率分布,對單節(jié)點信息集,則可理解為“判斷達(dá)到該節(jié)點的概率為l”。,要求2:給定各博弈方的“判斷”,他們的策略必須是“序列理性”的。即在各個信息集,給定輪到選擇博弈方的判斷和其他博弈方的“后續(xù)策略”,該博弈方的行為及以后階段的“后續(xù)策略”,必須使自己的得益或期望得益最大。要求3:在均衡路徑上的信息集處,“判斷”要符合貝葉斯法則和各博弈方的均衡策略。要求4:在非均衡路徑上的信息集處,“判斷”也要符合貝葉斯法則和各博弈方在此處可能有的均衡策略。,這是完美貝葉斯均衡的比較完全的定義方法。之所以稱這種均衡為完美貝葉斯均衡,首先是因為它的第二個要求“序列理性”,與子博弈精煉納什均衡中的子博弈完美性要求相似;其次是因為要求3和要求4中規(guī)定“判斷”的形成必須符合貝葉斯法則。根據(jù)上述定義不難看出,子博弈精煉納什均衡是完美貝葉斯均衡在完全且完美信息動態(tài)博弈中的特例。即在完全且完美信息博弈中子博弈精煉納什均衡就是完美貝葉斯均衡。,實際上,序列理性用于子博弈中就是指子博弈的完美性,用在整個博弈中就是納什均衡概念,而在完全且完美信息動態(tài)博弈中,所有輪到選擇博弈方的信息集都是單節(jié)點的,他們對博弈達(dá)到該節(jié)點的“判斷”都是概率等于1,這些判斷當(dāng)然都是滿足貝葉斯法則和以其他博弈方的后續(xù)策略為基礎(chǔ)的。更進一步,完美貝葉斯均衡在靜態(tài)博弈中就是納什均衡。,2.均衡要求的初步解釋下面我們以圖5.12中的完全但不完美信息動態(tài)博弈為例,進一步說明上述要求的重要性。1R(1,3)L(p)M(1-p)22UDUD(2,1)(0,0)(0,0)(0,1)圖5-12完全但不完美信息動態(tài)博弈,,,,,,,,,,圖5.12是一個兩博弈方各一次選擇的動態(tài)博弈。因為在博弈方1第一階段選擇不是R的情況下,博弈方2無法看到博弈方1究竟選擇的是L還是M,因此博弈方2具有不完美信息,這是一個不完美信息的動態(tài)博弈。如果輪到博弈方2選擇時(博弈方1第一階段沒選R),若他不對博弈方1的選擇給出判斷的話,則他就不知該選U和D中哪一個才合理。因此,博弈方2在這兩個節(jié)點信息集處須對到達(dá)這兩個節(jié)點的可能性進行判斷,也就是L、M兩條路徑的“判斷”是決策的必要基礎(chǔ),從而也是均衡策略的基礎(chǔ)。這就說明了要求1的必要性。,要求2也是非常必要的。從圖中可知,除了原來的博弈之外,該博弈不存在任何其他真子博弈(子博弈完美性要求自然滿足),于是,對于這類博弈,子博弈精煉納什均衡定義實際上就是納什均衡,從圖5-12可知(L,U)和(R,D)都是納什均衡。然而,(R,D)顯然依賴于一個不可信威脅:那就是博弈方2威脅在輪到自己選擇時將唯一地只選D,但是D是一個劣策略,至少劣于U。如果博弈方2采取這個策略,博弈方1的最佳對策就是第一階段直接選擇R使博弈結(jié)束,雙方得益是(1,3)。博弈方1清楚,理性的博弈方2在什么情況下都不會采用D策略,因此,博弈方1決不會(只要他是理性的)因為博弈方2威脅采用D而被迫采取策略R,為了最大化自己的得益,博弈方1一定會采取L策略,迫使博弈方2只得采取U策略。,上述分析反應(yīng)了這樣一個事實,在完全但不完美信息博弈中,盡管(R,D)是一個納什均衡,可是它依賴于一個不可信的威脅,理應(yīng)從合理的預(yù)測中剔除掉。因此,要求2對于保證不完美信息動態(tài)博弈的均衡策略中沒有不可信的威脅或承諾具有關(guān)鍵作用。為了進一步說明要求1和要求2的必要性,我們假定當(dāng)博弈方2在博弈方1第一階段沒有選R的情況下,“判斷”博弈方1選L的概率為p,選M的概率l-p,在給定這樣的判斷的前提下,博弈方2選擇U的期望得益為:,而選D的期望得益為:顯然,當(dāng)p>1-p時,即p>1/2時,博弈方2選U的得益總大于選D的得益,根據(jù)要求2,博弈方2不會選D,只會選U。這時,博弈方1在第一階段的選擇就應(yīng)該是L,而非M,也非R。因此,博弈方1第一階段選L,博弈方2在博弈方1第一階段未選R的情況下選擇U,加上博弈方2對博弈方1選L、M的概率判斷p和1-p(p>1-p),構(gòu)成一個滿足序列理性要求的策略組合(注意這里還沒有稱為完美貝葉斯均衡),滿足了要求1和要求2事實上已經(jīng)排除了前面提及的那個依賴于不可置信威脅從而不合理的納什均衡策略(R,D)。,對于要求3和要求4中的“均衡路徑上”和“非均衡路徑上”一對概念,首先要弄清什么是均衡路徑。在不完美信息博弈中,由于至少對一個博弈方的一個階段來說,博弈實際達(dá)到何處是無法看到的,因此即使按均衡策略進行博弈,某些信息集是否一定會達(dá)到也不確定。所以,在這種博弈中所謂“在均衡路徑上”的信息集意味著如果博弈按照均衡策略進行,則該信息集會以正的概率達(dá)到,而“不在均衡路徑上”的信息集就意味著博弈按均衡策略進行時絕對不可能達(dá)到,或者達(dá)到的概率為0。,對于圖5-12中博弈方2的信息集,當(dāng)博弈方1第一階段的均衡策略選擇是R時不在均衡路徑上,而當(dāng)不是R時就在均衡路徑上。清楚了什么是“在”和“不在”均衡路徑上的信息集以后,我們現(xiàn)在用圖5-12中博弈為例來分析一下要求3和要求4。首先討論要求3。為此,我們先假設(shè)均衡策略組合就是上面提到的“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”。,首先,因為該博弈中只有博弈方2有一個兩節(jié)點信息集,因此要求3實際上針對的就是博弈方2在其兩節(jié)點信息集處的“判斷”;其次,本博弈兩博弈方的選擇都是針對獲取最優(yōu)得益的主動選擇,沒有非主動選擇和外生不確定性,因此不需要額外信息幫助“判斷”;第三,在本博弈中博弈方2的“判斷”是直接針對博弈方1的上期選擇的,因此不存在條件概率問題,貝葉斯法則自動滿足;第四,要求3要求博弈方2對博弈方1的上期選擇的“判斷”符合各博弈方的均衡策略,在這里就是符合博弈方1第一階段的選擇和博弈方2自己本階段的選擇。,由于博弈方1的均衡策略在第一階段選擇的是L,因此只有博弈方2的“判斷”是“博弈方1選擇L的概率p=1”才與博弈方1的策略相符合,而且這種判斷也與博弈方2自己在本階段的選擇U相符合,因此該“判斷”正是博弈方2決策和雙方策略均衡的穩(wěn)定基礎(chǔ)。如果博弈方2“判斷”p=0.75,則首先與博弈方1的選擇不完全符合,而且這種判斷對博弈方2選U的信心有不良影響,從而均衡就有不穩(wěn)定性。如果博弈方2“判斷”p=0.25,則與所設(shè)均衡策略組合“博弈方1選L,博弈方2選U”是完全矛盾的。,上述分析充分說明了在不完美信息博弈中,“判斷”和均衡策略之間的相互依存關(guān)系,只有兩者是一致、協(xié)調(diào)的,才可能是真正的均衡。這正是要求3的真實含義。現(xiàn)在我們討論要求4。首先對于均衡策略組合“博弈方1在第一階段選擇L,博弈方2在第二階段選擇U”來說,因為博弈方2的多節(jié)點信息集在均衡路徑上,不存在不在均衡路徑上需要“判斷”的信息集,因此要求4自動滿足,不用再作討論。為此我們針對另一個納什均衡策略組合(R,D),即“博弈方1第一階段選擇R,博弈方2第二階段選擇D”來討論。,在該均衡策略組合下,博弈方2的兩節(jié)點信息集是不在均衡路徑上的信息集。要求4要求博弈方2此時在這個信息集的“判斷”,也要滿足貝葉斯法則和雙方的均衡策略。同要求3,貝葉斯法則仍然自動滿足,因此我們只需要討論博弈方2的“判斷”與雙方在此處可能有的均衡策略的一致性。從得益分布情況可知,很顯然,如果萬一博弈方1在第一階段偏離了上述均衡策略R,按照前面的分析博弈方2一定會“判斷”博弈方1必然選擇L策略,,而博弈方1這時選擇L的概率p=1這一判斷是不符合要求4的,因為這與博弈方2自己的均衡策略D不符合。因此博弈方2此時的“判斷”只能是博弈方1選M的概率1-p=l,這樣博弈方2的“判斷”就與自己的策略相一致了。但是,博弈方2“判斷”1-p=1,意味著博弈方1肯定選擇了M。這顯然是有問題的,因為對于博弈方1來說,M既是相對于R的下策,也是相對于L的下策,即使他不愿選R,也只會選L而不會選M。,因此,博弈方2的“判斷”1-p=1雖然可以與自己的策略D相符合,但卻無法與博弈方1在此處可能有的均衡策略相符合,這意味著該“判斷”也不滿足要求4。事實上,在上述得益結(jié)構(gòu)下,該博弈不可能存在與均衡策略組合“博弈方1第一階段選擇R,博弈方2第二階段選擇D”相符合的不在均衡路徑上的博弈方“判斷”,這實際上就意味著(R,D)策略組合不可能是該博弈具有真正穩(wěn)定性的完美貝葉斯均衡。,3.關(guān)于判斷形成的進一步解釋例1,二手車交易。圖5.11中的二手車交易博弈中,當(dāng)然是在賣方(博弈方1)決定賣以后,買方(博弈方2)的選擇信息集需要作出“判斷”。首先,買方需要的“判斷”是在博弈方1決定賣的情況下車況是好還是差,或者好、差的機會各是多少。我們可以用兩個條件概率p(g|s)和p(b|s)來表示買方對賣方?jīng)Q定賣車時車況好、差的“判斷”(顯然有p(g|s)+p(b|s)=1)。在買方作出判斷之前,先要知道車況好與差的機會各有多少,也即賣方在第一階段使用車子的情況是好還是差的可能性。我們用P(g)和P(b)來表示它們的概率,當(dāng)然這兩個概率一般是通過經(jīng)驗性的知識和數(shù)據(jù),或平均情況得到。,但是,光有這兩個概率仍然不能得出需要的判斷p(g|s)和p(b|s)。因為賣方在車況好、差兩種情況下對賣和不賣的選擇往往是不同的,并不是不管好、差都會選擇賣,因此上述車況好、差的概率不一定等于所賣車子好、差的概率。不過,如果我們知道賣方在好、差兩種情況下選擇賣或不賣的概率分別是多大,就可以根據(jù)貝葉斯法則計算出條件概率p(g|s)和p(b|s),也就是買方需要的“判斷”。若p(s|g)和p(s|b)分別表示車況好、差時賣方選賣的概率,那么根據(jù)貝葉斯法則:,而p(b|s)可以根據(jù)p(b|s)=1-p(g|s)確定。因此我們的關(guān)鍵任務(wù)是確定賣方在車況好、差兩種情況下,分別選擇賣和不賣的概率分布p(s|g)、1-p(s|g)和p(s|b)、1-p(s|b)。由于賣方是主動選擇和理性行為的,因此上述概率分布取決于賣方的均衡策略。,根據(jù)圖5-11中的得益情況,首先可以肯定當(dāng)車況好時賣方肯定會選擇賣,因為賣掉有正的得益,賣不掉跟不賣相比也沒任何區(qū)別,因此p(s|g)=1肯定成立。相反,在車況差時選擇賣而賣不出去就有損失,因此如何選擇就需要更多的斟酌。賣方究竟是應(yīng)該選擇賣還是不賣,或者選擇混合策略,需要考慮賣出去的機會,即買方選擇買的概率的大小。,如果我們假設(shè)買方選擇買的概率是0.5,那么賣方在車況差的情況下選擇賣的期望得益為0.51+0.5(-1)=0,與不賣的得益相等,作為一個風(fēng)險中性的博弈方,賣方可采用(0.5,0.5)的概率分布選擇賣或不賣的混合策略。這時候,買方“判斷”p(s|b)=0.5就是符合賣方均衡策略的,并且也符合自己的均衡策略。有了p(s|g)=1和p(s|b)=0.5這兩個概率判斷,再假設(shè)已知總體車況好、差的概率p(g)=p(b)=0.5,則根據(jù)貝葉斯法則我們不難算出:,這就是買方在自己選擇的兩節(jié)點信息集處對賣方所賣車中好車所占比例的“判斷”。對差車所占比例的“判斷”就是。由于在賣方的上述策略下,買方選擇的信息集至少有相當(dāng)大的概率會達(dá)到,因此該信息集是在均衡路徑上的信息集。這就是說,我們通過分析得到的上述“判斷”是滿足要求3的判斷。這里的分析進一步使我們對要求3使均衡策略和判斷之間具有的相互依存關(guān)系有了更深的體會。,例2,為了進一步理解4個要求的意義,我們再分析一個簡單的例子。圖5-13是一個有三個博弈方的三階段不完全信息動態(tài)博弈。第一階段博弈方1有F和B兩種選擇,他的選擇博弈方2和博弈方3都能看見。第二階段博弈方2有L和R兩種選擇,跟在后面的博弈方3卻看不見博弈方2的選擇。博弈方3的信息集是一個兩節(jié)點信息集,即信息是不完美的。一般地我們假設(shè)他“判斷”博弈方2選L和R的概率分別是p和1-p。如果博弈方1在第一階段選F,則博弈繼續(xù)下去,共有四種可能的結(jié)果,各方得益分別為相應(yīng)得益數(shù)組中同次序數(shù)值。,1FB2(2,0,0)L(p)R(1-p)33UDUD(1,2,1)(3,3,3)(0,1,2)(0,1,1)圖5-13三博弈方三階段動態(tài)博弈,,,,,,,,,用逆推歸納法先考察博弈方3的選擇,他選U的期望得益為Pl+(l-P)2=2-P,選D的期望得益為P3+(1-P)1=1+2P,因此當(dāng)2-p>1+2p,即p<l/3時他該選U,當(dāng)p>l/3時他該選D,P=1/3時選U、D或者混合策略都可以?,F(xiàn)在先假設(shè)他“判斷”p>1/3,那么合理選擇是D。再來看博弈方2的選擇。實際上博弈方2的選擇必然只有L一種,因為L是他相對于R的嚴(yán)格上策,因此他無需考慮博弈方3在第三階段究竟會如何選擇?,F(xiàn)在再看博弈方3的“判斷”。當(dāng)然P>1/3是符合博弈方2的策略的,但更準(zhǔn)確地講,完全符合博弈方2均衡策略的博弈方3的“判斷”是P=1。最后再看博弈方1的選擇。他知道從博弈方2的選擇開始的子博弈的均衡必然為(L,D),意味著自己選擇F可以獲得3單位得益,比選B得益2要好,因此F是他的均衡策略。這樣我們找到了一個均衡策略組合(F,L,D),以及與之相應(yīng)的博弈方3的“判斷”p=1。,為了說明要求4的必要性,我們可考察一下策略組合(B,L,U)及相關(guān)的博弈方3“判斷”p=O。首先,該策略組合是一個納什均衡,沒有哪個博弈方可以通過單獨改變自己的策略改善得益。其次在博弈方3對博弈方2選擇的“判斷”p=0時,(B,L,U)是序列理性的。并且,因為在均衡路徑上沒有需要判斷的信息集,因此要求3自動滿足。也就是說,策略組合(B,L,U)和博弈方3的“判斷”p=O是滿足完美貝葉斯均衡的要求1—3的。如果沒有要求4,我們根據(jù)上述策略組合和“判斷”滿足前三個要求就會判定它構(gòu)成一個完美貝葉斯均衡。但顯然這種均衡是極不理想的,這時各方得益為(2,O,O)是比較差的一種結(jié)果,問題是只有前三個要求的完美貝葉斯均衡不能排除這種不理想的結(jié)果。,在這個問題上,要求4就可以起作用了。因為要求4強制博弈方3即使在非均衡路徑上的信息集處的“判斷”也必須符合各方的均衡策略,在上述均衡策略組合下博弈方3的信息集正是不在均衡路徑上的信息集,但博弈方3在此處的“判斷”p=0,顯然與博弈方2的策略L不相符合,因此上述策略組合和“判斷”不能構(gòu)成完美貝葉斯均衡,這就把(B,L,U)排除出了完美貝葉斯均衡的范疇,從而使得完美貝葉斯均衡是更加可靠、穩(wěn)定和合理的均衡概念。,通過上述分析可知,完美貝葉斯均衡定義中的4個要求確實是判斷(檢驗)完全但不完美信息動態(tài)博弈中各博弈方的策略組合和相應(yīng)“判斷”是否具有真正穩(wěn)定性的關(guān)鍵標(biāo)準(zhǔn)。其中要求1-3體現(xiàn)了完美貝葉斯均衡的本質(zhì)內(nèi)容,要求3和要求4特別體現(xiàn)了在這種均衡概念中“判斷”的重要性,“判斷”與策略的同等地位。也就是說,對于完美貝葉斯均衡來說,一個均衡不再僅僅由每個博弈方的一個策略組合構(gòu)成,還必須包括各博弈方在需要他們選擇的信息集(主要是多節(jié)點信息集)處的合理“判斷”。此外,這些要求同時也給我們提供了尋找不完美信息動態(tài)博弈完美貝葉斯均衡的思路和方法。,- 1.請仔細(xì)閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
9.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標(biāo),表示該PPT已包含配套word講稿。雙擊word圖標(biāo)可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 產(chǎn)業(yè)經(jīng)濟學(xué) 產(chǎn)業(yè) 經(jīng)濟學(xué) 第五 博弈
鏈接地址:http://kudomayuko.com/p-11498853.html