Skip to content
Go back

第三讲 完全信息动态博弈

Edit page

第三讲 完全信息动态博弈

3.1 扩展式博弈

扩展式博弈(extensive form)的要素:

为了描述扩展式博弈的五要素,我们可以用博弈树(game tree)来表述。

picture 3

v0v_0 为初始结,v1,v2,v5v_1, v_2, v_5 为决策结,v3,v4,v7,v8v_3, v_4, v_7, v_8 为终点结。

完全(complete)且完美(perfect)信息:在博弈进行的每一步当中,要选择行动的参与人知道这一步之前的整个过程;

每一条棱都表示参与人的一个行动; 每个节点最多只能有一个父节点; 并不要求每个链条都要有所有的参与人;

3.2 信息集

信息集(information set):满足以下三个条件的决策节的集合,

3.3 策略与行动

再同时的静态博弈决策中,行动即策略;但在动态博弈中,策略与行动不等价,不同信息集下所能采取的行动是不同的,而所有的信息集下所能采取的所有行动的加总,则是策略;

对于完美信息博弈,混合策略和行为策略是等价的;

3.4 扩展式的标准式表达

例子 1:动态猜字游戏的标准式

picture 4

picture 5

s1s_1

例子 2:动态性别战的标准式

picture 6

picture 7

3.5 子博弈

在动态性别战中,Nash 均衡有(足球,足球足球)、(足球,足球芭蕾)、(芭蕾,芭蕾芭蕾),但是男生是先手,他没有理由选择主动选择芭蕾,所以均衡(芭蕾,芭蕾芭蕾)看起来并不合理;

我们将引入更严格的均衡概念以移除不合理的 Nash 均衡;

扩展式博弈的子博弈需要满足一下三个条件:

子博弈精炼 Nash 博弈

ps. 子博弈精炼 Nash 均衡是更强的 Nash 均衡,所以当某(对整体而言)Nash 均衡在子博弈中不是 Nash 均衡那该均衡就不是子博弈精炼均衡;

3.6 逆向归纳法

例子 1:动态性别战的逆向归纳

picture 8

例子 2:Stackelberg 垄断模型

解法: 从企业 2 的子博弈出发,求出企业 2 对于企业 1 的最优反应:

max0q2u2(q1,q2)=q2[a(q1+q2)c]\max \limits_{0 \le q_2 \le \infin} u_2 (q_1, q_2) = q_2 [a - (q_1 + q_2) - c]

最优反应函数:R2(q1)=aq1c2R_2(q_1) = \dfrac{a - q_1 - c}{2}

企业 1 在知道企业 2 会选择最优反应的基础上选择产量:

max0q1u1(q1,R2(q1))=q1[a(q1+q2)c]\max \limits_{0 \le q_1 \le \infin} u_1 (q_1, R_2(q_1)) = q_1 [a - (q_1 + q_2) - c]

得到逆向归纳解:q1=ac2,R2(q1)=ac4q_1 = \dfrac{a - c}{2}, R_2(q_1) = \dfrac{a - c}{4}

3.7 逆向归纳法的适用范围

3.8 不完美信息博弈的逆向归纳

  1. 如果遇到非单节信息集就跳过先,继续向上直到遇到一个单节信息集;
  2. 然后同时考虑单节信息集行动的参与人的选择,以及被忽略的非单节信息集的参与人的选择;(相当于假定他们同时行动)
  3. 此外,还能将非单节信息集当作完全信息博弈来处理;

例子:不完美信息进入障碍博弈

picture 9

该博弈存在一个子博弈,该子博弈由于不完美信息集的存在,我们可以将其看作完全信息静态博弈来求解 Nash 均衡,解得 Nash 纯策略均衡为:(低价,容忍);

回到上一层博弈,初始节挑战者将选择进入市场(进入市场的均衡比不进入市场的支付要高),所以子博弈完美 Nash 均衡为(低价,容忍);

3.9 重复博弈

有限重复博弈

例子:阶段博弈出现多个均衡的情况

折现因子 δ=1\delta = 1; 考虑以下博弈重复两阶段的的情况:

picture 10

picture 11

考虑一个策略组合: (M1L1L1L1L1R1L1L1L1L1,M2L2L2L2L2R2L2L2L2L2)(M_1L_1L_1L_1L_1R_1L_1L_1L_1L_1, M_2L_2L_2L_2L_2R_2L_2L_2L_2L_2) 不是说这个博弈就是均衡博弈; 可以看到这个策略组合在第二阶段构成一个 Nash 均衡; 现在考察是否构成整个博弈的 Nash 均衡; 根据这个策略组合,通过加权和的计算得到下表;

picture 12

可以看到该策略组合的确是整个博弈的 Nash 均衡;

注:这里并不是在解一个 Nash 均衡,而是在验证一个策略集是否是整体博弈的 Nash 均衡解;

无限重复博弈


Edit page
Share this post on:

Previous Post
第一讲 导论
Next Post
第二讲 完全信息静态博弈