- Published on
懦夫博弈
- Authors
- Name
- Rickee
懦夫博弈(Game of chicken)來源於上世紀 50 年代的一種賭局:雙方駕車相向而行,誰先打方向盤誰就是懦夫(chicken),也就輸掉了賭局。但是,如果都不打方向盤,則兩車相撞,非死即傷。以相撞的損失為十倍賭資計,收益矩陣大致可做如下表示:
這個博弈存在兩個純策略納什均衡,即一方直行,一方相讓。
下面考慮混合策略納什均衡。混合策略要求給定對方兩種策略的選擇概率,己方選擇兩種策略的期望收益相同。否則將退化為純策略均衡。
- A 對於轉向/直行無差異:。
- B 對於轉向/直行無差異:。
解得 。也即混合策略納什均衡為(90% 轉彎 + 10% 直行,90% 轉彎 + 10% 直行)。雙方各保持 10% 直行的威懾,正是為了確保對方 90% 轉彎的可能性。
不對稱損失
如果雙方車輛堅固程度不同(或者發動核戰爭的損失不同、對貿易戰的經濟抗性不同等),導致直行對撞的損失 和 不同時,即:
很顯然,兩個純策略納什均衡不受影響,依然是(轉彎,直行)和(直行,轉彎)。
考慮混合策略納什均衡:
解得:
換言之,較為弱小、更害怕對撞的一方,在混合策略納什均衡中需要以更高的概率選擇直行,因為自身的弱小減弱了威懾的價值。
序貫博弈
現實中的博弈並不真的像 game of chicken 那樣同時進行、同時出牌、在同一瞬間結算。考慮 A 先行動的序貫博弈:
序貫博弈分解圖(A 先手)
因此子博弈完美納什均衡是:A 選擇直行 → B 觀測到 A 選擇直行後,選擇退讓。換句話說,如果這個博弈是序貫博弈,那麼先發者只需選擇直行即可獲得勝利。想想這樣一個場景:你邀請對方來你駕駛室看一眼,你已經卸掉了剎車踏板和方向盤,通過自我約束來傳遞出「我是 100% 亡命徒」的信號,從而獲得勝利。這種例子並不少見。然而你憑什麼可以「先邀請對方來你駕駛室看一眼」?
序貫博弈通常假定其中一方有明確、公認的機會先行動。然而,在雙方都是理性人的情況下,雙方都一定會搶先手;也就是說,在序貫博弈之前,會有一個關於「誰先行動」或「誰能成功做出可信承諾」的「元博弈」(meta-game),這將導致序貫博弈的前提崩潰。這個元博弈的性質有待界定。如果雙方都從 t=0 開始行動,並且各有 50% 的概率搶到先手,並且觀察到對方搶先後立即停止元博弈進入序貫博弈,那整個博弈的勝負將取決於 50-50 的元博弈的勝負。另一種情況是,如果雙方都從 t=0 開始行動,且在充分的時間後才能觀察到對方的行動,那麼整個博弈將重新變回同時博弈。
例子:中美關稅戰
在核威懾、貿易戰、軍備競賽等政治博弈的語境下,博弈更可能是分階段的,且沒有明確的終點(冷戰就是很好的例子)。以中美關稅戰為例,站在 2025 年 5 月,關稅戰基本是回合製遊戲,儘管中國的反擊通常十分及時(當天內完成),但這依然是序貫博弈。

中美關稅戰的升級路徑
以相安無事作為基準的 收益,我們可能會得出如下的收益矩陣:
其中:
- 如果一方採取強硬措施之後另一方妥協,前者可能可以藉機在某些貿易條款、市場准入、補貼政策上要求對方做出改變。前者少量獲利,後者少量受損。
- 如果一方採取強硬措施之後另一方展開反擊,雙方進入更高強度的貿易戰,雙方經濟利益均大量受損。
僅從經濟利益的角度出發,關稅戰是標準的懦夫(序貫)博弈模型。雖然毫無疑問貿易戰會在某個時間節點迎來雙方的相互妥協,但終點/誰發起終止信號均不明確,因此考慮無限次序貫博弈(Infinitely Repeated Game)的情況。根據無名氏定理,任何個體理性(收益大於或等於最小最大化收益(Minimax Payoff))的收益組合都可以作為某個子博弈完美納什均衡的結果。
如果中國的目的是讓美國收益最小化:
- 如果美國選擇「強硬」,那麼中國也會選擇「強硬」,此時美國的收益為 -10。
- 如果美國選擇「妥協」,那麼中國仍然選擇「強硬」,此時美國的收益為 -5。
因此美國的 Minimax Payoff = -5,根據對稱性可得中國的 Minimax Payoff 也是 -5。因此,任何大於或等於 的策略,對於雙方都是個體理性的,可以在某些情況下成為子博弈完美納什均衡。其中 ,即相安無事,是最符合實際情況的、值得雙方共同維護的均衡。
為了維持均衡,雙方必須有觸發策略(Trigger Strategy)應對對方對均衡的偏離。冷酷觸發策略(默認選擇合作,若一次背叛則此後永遠背叛)雖有其合理之處,但顯然不符合現實。更常見的觸發策略是以牙還牙策略(默認選擇合作,此後每次選擇都取決於對方上一回合的選擇),這也是當前中國採取的策略。
可以從貼現率 的角度解釋特朗普對於(合作,合作)策略的偏移。作為處於第二任任期的總統,由於沒有再次連任的壓力,特朗普可能會更關注在任期內能夠實現的、看得見的「政績」或目標(這一點對習近平也同理,參見其在 2022-2024 年對台灣問題的強硬態度)。如果某些行動能夠在短期內帶來顯著的政治回報(例如,在貿易戰中表現強硬、獲得對方一些表面上的讓步),即使這些行動可能導致長期的負面後果,只要這些後果主要在其卸任後才顯現,特朗普可以無所謂。特朗普本人的執政風格和個人性格也支持「對他而言 可能相對小」的觀點。