Skip to content
Go back

第四讲 不完全信息静态博弈

Edit page

第四讲 不完全信息静态博弈

假设

信念的概念

Harsanyi 转换

我们无法直接对不完全信息博弈进行分析,需要通过 Harsanyi 转换,将不完全信息博弈转换成不完美信息博弈; 通过引入一个虚拟的参与人“自然”,让自然首先行动,决定每个参与人的类型。每个参与人知道自己的类型,不知道别的参与人的类型,但是知道每个参与人的类型以及概率分布;

标准式

Bayes 推断

由于每个参与人都知道自己的类型 tit_i,所以她可以使用共同先验知识来形成对于其他参与人类型的后验信念; Bayes 推断是一个条件概率:pi=pi(titi)p_i = p_i(t_{-i}|t_i)这里的 tit_i 是参与人自己的类型,tit_{-i} 是其他参与人的类型。该条件概率描述的是,参与人在知道自己是什么类型的情况下,对其他参与人的类型推断的概率;

p(t)p(t) 表示自然赋予参与人的类型的先验分布。根据 Bayes 法则,得到后验信念为:

pi(titi)=p(titi)p(ti)=p(titi)tiTip(titi)p_i(t_{-i}|t_i) = \dfrac{p(t_{-i}t_i)}{p(t_i)} = \dfrac{p(t_{-i}t_i)}{\sum \limits_{t_{-i} \in T_{-i}} p(t_{-i}t_i)}

Bayes 博弈

Bayes 博弈的标准式表达 G(A1,,An;T1,,Tn;p1,,pn;u1,,un)G(A_1, \dots, A_n; T_1, \dots, T_n; p_1, \dots, p_n; u_1, \dots, u_n)

策略集:参与人 ii 的纯策略集 Si={si(ti)}S_i = \{s_i(t_i)\} 是一个值域为 AiA_i,定义域为 TiT_i 的所有可能的函数集。而混合策略是基于纯策略之上的;

我们可以将参与人的类型看成是他们自己的信息集:当参与人 ii 的类型由“自然”选定时,就可以看成是他在一个与他类型相同的唯一信息集上进行决策。这时,一个纯策略就是在每一个信息集上选择行动;

要点:

对于 Bayes 博弈:

G={A1,,An;T1,,Tn;p1,,pn;u1,,un}G = \{A_1, \dots, A_n; T_1, \dots, T_n; p_1, \dotsm, p_n; u_1, \dots, u_n\}

有纯策略 Bayes-Nash 均衡 ss^*

s={s1,s2,,sn}s^* = \{s_1, s_2, \dots, s_n\}

若每一个参与人 ii 的每一个类型 tiTit_i \in T_i 以及每一个行动 aiAia_i \in A_i 都有:

tiTipi(titi)ui(si(ti),si(ti))tiTipi(titi)ui(ai,si(ti))\sum \limits_{t_{-i} \in T_{-i}} p_i(t_{-i}|t_i) u_i(s^*_i(t_i), s^*_{-i}(t_{-i})) \ge \sum \limits_{t_{-i} \in T_{-i}} p_i(t_{-i}|t_i) u_i(a_i, s^*_{-i}(t_{_i}))

通过求解由期望支付函数组成的博弈矩阵,解出 Bayes-Nash 均衡;

机制设计

机制设计是一类特殊的不完全信息静态博弈,目的在于披露私人信息;

一套完整的机制具有 nn 个参与人的行动 AiA_i 以及一个支付函数 u(.)u(.)

直接机制:参与人的行动集和类型集相同; 间接机制:参与人的行动集和类型集不相同;

典型的机制:

显示性原理 任何 Bayes 博弈的任何 Bayes-Nash 均衡都可以通过一个激励相容的机制实现; 用人话说就是:我总能找到一个游戏规则让玩游戏的人暴露自己的真实情况;


Edit page
Share this post on:

Previous Post
第二讲 完全信息静态博弈
Next Post
现代操作系统