博弈论中的均衡精炼:完美贝叶斯均衡、序贯均衡与颤抖手均衡详解
1. 引言:为什么需要均衡精炼?
在博弈论中,纳什均衡是分析策略互动的核心工具,但其存在一个显著缺陷:无法排除不合理的均衡。例如,某些均衡依赖于“不可置信的威胁”(incredible threats)。为此,学者提出了均衡精炼(Equilibrium Refinements)的概念,旨在通过附加约束条件筛选出更合理的均衡。本章将重点探讨三种经典精炼方法:完美贝叶斯均衡(PBE)、序贯均衡(Sequential Equilibrium)和颤抖手均衡(Trembling Hand Perfect Equilibrium),并结合公式与案例分析其应用。
2. 完美贝叶斯均衡(PBE)
2.1 定义与公式
完美贝叶斯均衡适用于多阶段不完全信息博弈,要求玩家在每一个信息集上的策略是最优的,且信念通过贝叶斯规则更新。其核心公式包括:
策略最优性:
对于玩家 iii,在信息集 hhh 上的策略 σi\sigma_iσi 满足:
σi(h)∈argmaxaiEμ(⋅∣h)[ui(ai,a−i)∣h] \sigma_i(h) \in \arg\max_{a_i} \mathbb{E}_{\mu(\cdot|h)}[u_i(a_i, a_{-i}) | h]
σi(h)∈argaimaxEμ(⋅∣h)[ui(ai,a−i)∣h]贝叶斯更新:
信念 μ(θ∣h)\mu(\theta|h)μ(θ∣h) 表示在信息集 hhh 上对类型 θ\thetaθ 的后验概率,更新公式为:
μ(h)(θ)=P(θ)⋅σ(θ)(h)∑θ′P(θ′)⋅σ(θ′)(h) \mu(h)(\theta) = \frac{P(\theta) \cdot \sigma(\theta)(h)}{\sum_{\theta'} P(\theta') \cdot \sigma(\theta')(h)}
μ(h)(θ)=∑θ′P(θ′)⋅σ(θ′)(h)P(θ)⋅σ(θ)(h) 其中 P(θ)P(\theta)P(θ) 是先验概率,σ(θ)(h)\sigma(\theta)(h)σ(θ)(h) 是类型 θ\thetaθ 选择路径 hhh 的概率。
2.2 案例分析:劳动力市场信号博弈
场景:
员工有两种类型:高能力(θH\theta_HθH)和低能力(θL\theta_LθL),先验概率分别为 P(θH)=0.2P(\theta_H)=0.2P(θH)=0.2 和 P(θL)=0.8P(\theta_L)=0.8P(θL)=0.8。员工通过选择教育水平 eee 发送信号,成本为 c(θ,e)c(\theta, e)c(θ,e)(高能力者成本更低)。雇主根据 eee 推断员工类型,并给出工资 w(e)w(e)w(e)。
PBE 求解:
高能力员工选择 eHe_HeH,低能力选择 eLe_LeL,满足分离均衡条件:
w(eH)−c(θH,eH)>w(eL)−c(θH,eL)w(eL)−c(θL,eL)>w(eH)−c(θL,eH) w(e_H) - c(\theta_H, e_H) > w(e_L) - c(\theta_H, e_L) \\
w(e_L) - c(\theta_L, e_L) > w(e_H) - c(\theta_L, e_H)
w(eH)−c(θH,eH)>w(eL)−c(θH,eL)w(eL)−c(θL,eL)>w(eH)−c(θL,eH)2. 雇主根据观测到的 eee 更新信念,并支付与边际产出匹配的工资。
3. 序贯均衡(Sequential Equilibrium)
3.1 定义与公式
序贯均衡比PBE更严格,要求策略和信念序列 {(σk,μk)}\{(\sigma^k, \mu^k)\}{(σk,μk)} 满足:
一致性:存在完全混合策略序列 σk→σ\sigma^k \to \sigmaσk→σ,且信念 μk\mu^kμk 由贝叶斯规则生成。序贯理性:在每一个信息集上,策略是最优的。
数学上,一致性条件可表示为:
limk→∞(σk,μk)=(σ,μ)\lim_{k \to \infty} (\sigma^k, \mu^k) = (\sigma, \mu)
k→∞lim(σk,μk)=(σ,μ)且对于所有信息集 hhh,μk(h)\mu^k(h)μk(h) 必须与 σk\sigma^kσk 兼容。
3.2 案例分析:连锁店博弈
场景:
在位者(Incumbent)在多个市场运营,潜在进入者(Entrant)决定是否进入某一市场。在位者可能通过“掠夺性定价”威胁阻止进入。
序贯均衡分析:
若进入者认为在位者会强硬反击(即使短期亏损),则选择不进入。一致性要求:即使反击概率极低,信念也需通过完全混合策略的极限得到支持(例如在位者偶尔“失误”表现出强硬)。
4. 颤抖手均衡(Trembling Hand Perfect Equilibrium)
4.1 定义与公式
颤抖手均衡要求策略对微小扰动(玩家以概率 ϵ\epsilonϵ 随机犯错)具有稳健性。其核心思想是:
每个策略必须是极限点,当其他玩家以 ϵ→0\epsilon \to 0ϵ→0 的概率颤抖时,该策略仍为最优。
数学表达为:
σi∈argmaxσi′Eσ−iϵ[ui(σi′,σ−iϵ)]\sigma_i \in \arg\max_{\sigma_i'} \mathbb{E}_{\sigma_{-i}^\epsilon}[u_i(\sigma_i', \sigma_{-i}^\epsilon)]
σi∈argσi′maxEσ−iϵ[ui(σi′,σ−iϵ)]其中 σ−iϵ=(1−ϵ)σ−i+ϵ⋅均匀分布\sigma_{-i}^\epsilon = (1-\epsilon)\sigma_{-i} + \epsilon \cdot \text{均匀分布}σ−iϵ=(1−ϵ)σ−i+ϵ⋅均匀分布。
4.2 案例分析:协调博弈
场景:
两个玩家选择“左”或“右”,若一致则各得1,否则得0。纳什均衡为(左,左)和(右,右),但后者可能因颤抖手失效。
颤抖手检验:
假设玩家1以 ϵ\epsilonϵ 概率选“右”,玩家2的最优反应是选“右”。当 ϵ→0\epsilon \to 0ϵ→0 时,(右,右)是颤抖手均衡,而(左,左)可能因信念不一致被排除。
5. 综合比较与应用
均衡类型核心要求适用场景完美贝叶斯均衡贝叶斯更新 + 子博弈完美多阶段不完全信息博弈序贯均衡一致性 + 序贯理性复杂动态博弈颤抖手均衡策略对微小扰动稳健排除非稳健纳什均衡应用场景:
PBE:信号博弈、拍卖设计。序贯均衡:重复博弈中的声誉机制。颤抖手均衡:机制设计中的稳定性验证。
6. 结论
均衡精炼通过附加理性约束,显著提升了博弈分析的精确性。完美贝叶斯均衡、序贯均衡和颤抖手均衡分别从信念更新、一致性和稳健性角度排除了不合理的纳什均衡。在实际应用中(如拍卖设计或市场竞争策略),需根据信息结构和动态特性选择合适的精炼方法。
参考文献:
朱·弗登博格, 让·梯若尔. 博弈论[M]. 北京: 中国人民大学出版社, 2010.