Chapter 10 : 博弈论模型¶

📖 阅读信息

阅读时间：7 分钟 | 中文字符：2760

博弈论的基本概念¶

博弈是多主体，优化是单主体

博弈论研究由一些带有相互竞争性质的主体所构成的体系的理论。它能以数字表示人的行为或为人的行为建立模式，研究对抗局势中最优的对抗策略和稳定局势，以及如何追求各方的最优策略和决定对策的结果，协助人们在一定规则范围内寻求最合理的行为方式

博弈的要素¶

参与者（Player）：参与博弈的决策主体
策略（Strategy）：参与者可以采取的行动方案
策略组合（Strategy Profile）：所有参与者选择的策略的集合
收益（Payoff）：参与者在某一策略组合下的收益
- 费用（Cost）：参与者在某一策略组合下需付出的代价

博弈论的假设¶

参与者是理性的，以最大化他的收益或最小化他的费用作为选择策略的准则

博弈的分类¶

合作博弈（Cooperative Game）：局中人之间可以结成联盟，协调彼此的策略，并对获得的收益进行再分配

静态博弈（Static Game）：所有参与者同时选择策略并行动，且只能行动一次，参与者选择策略时不知道其他参与者的选择。

完全信息（Complete Information）：参与者掌握其他参与者的可选策略和收益等信息

完美信息（Perfect Information）：在动态博弈中，参与者掌握其他参与者已选择的策略

简单例子¶

囚徒困境（Prisoner's Dilemma）¶

甲、乙两人共同犯罪，警方掌握了一部分犯罪事实，将他们带到警局分别讯问

若两人均承认所有罪行，则各被判处 6 个月徒刑
若一人认罪，一人不认罪，前者被轻判 1 个月徒刑，后者被重判 9 个月徒刑
若两人均不认罪，则以部分罪行各被判处 2 个月徒刑

	乙认罪	乙不认罪
甲认罪	甲6个月，乙6个月	甲1个月，乙9个月
甲不认罪	甲9个月，乙1个月	甲2个月，乙2个月

Nash 均衡¶

Nash 均衡（Nash Equilibrium）

（完全信息静态）博弈的某个局势，每一个理性的参与者都不会单独偏离它
- 对每一个参与者，在其他参与者策略不变情况下，单独采取其他策略，收益不会增加

纯策略与混合策略¶

纯策略（Pure Strategy）：参与者每次行动都选择某个确定的策略

混合策略（Mixed Strategy）：参与者可以以一定的概率分布选择若干个不同的策略

Nash 定理¶

若参与者有限，每位参与者的策略集均有限，收益函数均为实值函数，则博弈必存在混合策略意义下的 Nash 均衡

最优反应函数¶

对其他参与者的任一策略组合，参与者的最优反应函数为可使其收益达到最大的策略集合，记为 \(B_i(a_{-i})\)，即 \(B_i(a_{-i})=\{a_i^*|u_i(a_i^*,a_{-i})\geq u_i(a_i,a_{-i}), \forall a_i\in A_i\}\)

定义 \(\mathscr{B}(a)=(B_1(a_{-1}),B_2(a_{-2}),...,B_n(a_{-n}))\)，则充要条件可以写为 \(a^*\in\mathscr{B}(a^*)\)

如果 \(a^*\) 只有一个的话，即 \(a^*=\mathscr{B}(a^*)\)，我们可以由此想到不动点定理

不动点定理¶

（Brouwer）设 \(C\subset\R^n\) 是一个非空有界闭凸集，函数 \(f\) 在 \(C\) 上连续，则存在 \(x^*\in C\)，使得 \(f(x^*)=x^*\)
（Kakutani）设 \(C\subset\R^n\) 是一个非空有界闭凸集，\(P_0(C)\) 是 \(C\) 中所有非空子集的集合，集值映射 \(F:C\rightarrow P_0(C)\) 满足对任意 \(x\in C,F(x)\) 是 \(C\) 中的非空闭凸集，且 \(F\) 在 \(C\) 上上半连续，则存在 \(x^*\in C\)，使得 \(f(x^*)=x^*\)

Nash 均衡的例子¶

Battle of Sexes¶

♂️：一起看球赛，收益为3；一起逛街，收益为1；各自行动，收益为0

♀️：一起看球赛，收益为1；一起逛街，收益为3；各自行动，收益为0

(♂️,♀️)	♂️ 看球赛	♂️ 逛街
♀️ 看球赛	(3,1)	(0,0)
♀️ 逛街	(0,0)	(1,3)

可见，双方看球或双方逛街都是均衡状态

鸽鹰博弈（Hawk-Dove Game）¶

(A,B)	B:鸽子	B:鹰
A:鸽子	(0,0)	(-1,1)
A:鹰	(1,-1)	(-5,-5)

可见，一方鹰，另一方鸽子是均衡状态

石头剪刀布¶

不存在 Nash 均衡

让座¶

公交车上设有宽体单人座，可同时坐下两人但空间较普通双人座狭窄
乘车舒适度以单人就坐最佳，与人合坐次之，站立最差
两人上车后发现车厢中只余这一个座位，他们各自考虑就坐还是站立
- 若每人均为自身考虑，自身舒适度愈大愈好。试求其 Nash 均衡
- 若每人均为对方考虑，对方舒适度愈大愈好，且当对方站立时，宁愿陪同站立而不独坐。试求其 Nash 均衡

均为自身考虑：

	坐	站
坐	(2,2)	(3,1)
站	(1,3)	(1,1)

均为对方考虑：

	坐	站
坐	(3,3)	(1,4)
站	(4,1)	(2,2)

Braess 悖论¶

一路网中从 \(s\) 到 \(t\) 的车流总量为 1。车辆通过路网中每段道路的时间为通过该道路的车流量的非减函数
道路 \(su\) 和 \(vt\) 的通行时间函数为 \(c_1(x)=x\)，道路 \(sv\) 和 \(ut\) 的通行时间函数为 \(c_2(x)=1\)
Nash 均衡：一半车辆选择路 \(sut\)，一半车辆选择路 \(svt\)，每辆车的行驶时间为 \(c_1(\frac{1}{2})+c_2(\frac{1}{2})=\frac{3}{2}\)，所有车辆行驶总时间为 \(\frac{3}{2}\)
- 如果有一辆车由选择路 \(sut\) 转为选择路 \(svt\)，选择路 \(svt\) 的车辆数为 \(\frac{1}{2}+\epsilon\)，每辆车行驶总时间为 \(c_1(\frac{1}{2}+\epsilon)+c_2(\frac{1}{2}+\epsilon)=\frac{3}{2}+\epsilon\)

新建一条从 \(u\) 到 \(v\) 的道路，通行时间为 0
Nash 均衡：一半车辆选择路 \(sut\)，一半车辆选择路 \(svt\) 并不是 Nash 均衡，而是所有机动车选择 \(suvt\) 路，每辆车的行驶时间为 \(2c_1(1)=2\)，所有车辆行驶的总时间为 \(2\)
- 如果有一辆车由选择路 \(sut\) 转为选择路 \(suvt\)，选择路 \(su\) 的车辆数为 \(\frac{1}{2}\)，选择路 \(vt\) 的车辆数为 \(\frac{1}{2}+\epsilon\)，每辆车行驶总时间为 \(c_1(\frac{1}{2})+c_1(\frac{1}{2}+\epsilon)=\frac{3}{2}+\epsilon\)
- 如果有一辆车由选择路 \(suvt\) 转为选择路 \(svt\)，选择路 \(sv\) 的车辆数为 \(\epsilon\)，选择路 \(vt\) 的车辆数为 \(1\)，每辆车行驶总时间为 \(c_2(\epsilon)+c_1(1)=2\)

这体现出了低效的均衡

若社会费用为所有车辆行驶的总时间，对任意道路通行时间函数为线性函数的路网，任一 Nash 均衡的社会费用不超过最优社会费用的 \(\frac{4}{3}\) 倍

网络设计博弈¶

现有一由若干节点和线路组成的通讯网络，每个使用者可借此网络建立两点之间的通讯联系，为此需向网络所有者购买线路使用权
每条线路价格不同。若多个使用者共同使用某线路，费用由这些使用者分摊

这也是一个低效的均衡

\(k\) 个使用者，起点分别为 \(s_i,i=1,...,k\)，终点均为 \(t\)
从所有使用者整体利益来看，使用者 \(i\) 选择 \(s_i-v-t\) 最优，总费用是 \(1+\epsilon\)
使用者 \(i\) 选择 \(s_i-t\) 是唯一的一个 Nash 均衡，总费用为 \(\sum\limits_{i=1}^k\frac{1}{i}=O(\ln k)\)

合作博弈¶

讨价还价¶

问题描述

两人协商分配一笔总额为 1 万元的资金，约定如果达成协议，双方可以按协议取走各自应得的部分；若未达成协议，则两人分文不得，资金收归他用。

建模如下：

用 \((x,y)\) 表示甲、乙讨价还价后获得的资产。讨价还价后两人资产所有可能组成的组合记为 \(S\)，谈判破裂后两人可得的资产为 \(d_0=(x_0,y_0)\in S\)。一个讨价还价问题可用 \(<S,d_0>\) 来表示
讨价还价问题的解为一个函数 \(\varphi\)，对每个讨价还价问题 \(<S,d_0>\) ，有一个唯一的 \(d^*=(x^*,y^*)\in S\) 与之对应
Nash 应用公理化思想，首次给出了讨价还价问题的一种解
- 至少存在一 \((x,y)\in S\)，使得 \(x>x_0\) 且 \(y>y_0\)
- \(S\) 为有界闭凸集

讨价还价公理

讨价还价问题 \(<S,d_0>\) 的解 \(d^*=(x^*,y^*)\) 满足一下性质：

Pareto 有效性：若 \(d'=(x',y')\) 满足 \(x'\geq x^*,y'\geq y^*\)，且 \(d'\not=d^*\)，则 \(d'\not\in S\)
对称性：若 \(x_0=y_0\) 且集合 \(S\) 是对称的，即若 \((x,y)\in S\)，必有 \((y,x)\in S\)，则 \(x^*=y^*\)
仿射不变性：记 \(\tilde{S}=\{(\alpha_1x+\beta_1,\alpha_2y+\beta_2)|(x,y)\in S\},\tilde{d_0}=(\alpha_1x_0+\beta_1,\alpha_2y_0+\beta_2)\)，其中 \(\alpha_i>0,\beta_i,i=1,2\) 为实数，则讨价还价问题 \(<\tilde{S},\tilde{d_0}\) 的解为 \(d^*=(\alpha_1x+\beta_1,\alpha_2y+\beta_2)\)
无关选择独立性：设 \(<S,d_0>,<S',d_0>\) 为两讨价还价问题且 \(S'\subseteq S\)，若 \(<S,d_0>\) 的解 \(d^*\in S'\)，则 \(<S',d_0>\) 的解也是 \(d^*\)

讨价还价问题满足以上四条公理的解是唯一的，即为非线性规划（NLP）的最优解

证明最优解存在唯一性

存在性：由 \(S\cap\{(x,y)|x\geq x_0\}\) 为有界闭集，二元连续函数 \((x-x_0)(y-y_0)\) 的最大值存在
唯一性：
- 若存在两个最优解 \((x_1,y_1),(x_2,y_2)\)，则 \((x_1-x_0)(y_1-y_0)=(x_2-x_0)(y_2-y_0)\geq(\overline{x}-x_0)(\overline{y}-y_0)>0\)，那么有 \(x_1\not=x_0\Rightarrow x_1>x_0\Rightarrow x_1\not=x_2\)
- 不妨设 \(x_1<x_2\)，则 \(y_1>y_2\)。由 \(S\) 的凸性 \((\frac{x_1+x_2}{2},\frac{y_1+y_2}{2})\in S\)，而 \((\frac{x_1+x_2}{2}-x_0)(\frac{y_1+y_2}{2}-y_0)=(x_1-x_0)(y_1-y_0)+\frac{1}{4}(y_2-y_1)(x_1-x_2)>(x_1-x_0)(y_1-y_0)\) 矛盾

最优解的性质

破产清偿¶

两人 - CG问题 | Contested Garment¶

两人财产争议（CG问题）：

甲方声称拥有某物品全部产权，乙方声称拥有该物品一半产权
- 双方对该物品的一半产权属于甲方均无异议，对另一半产权双方均认为属于自己
双方各获得争议部分产权的一半，无异议部分归属甲方
甲方获得该物品产权的四分之三，乙方获得四分之一

推广

右侧引入容器，两个容器中水平面等高，细管内忽略不计。可以以此列出各个情况。

n 人 - 破产清偿¶

设债权人 \(i\) 的债务额为 \(d_i,i=1,...,n\)，剩余资产为 \(E,E<\sum\limits_{i=1}^nd_i\)。记 \(\mathbf{d}=(d_1,...,d_n)\) 。一个破产清偿问题可用 \(<E,\mathbf{d}>\) 来表示
破产清偿问题的解为一个函数 \(\varphi\)，对每个讨价还价问题 \(<E,\mathbf{d}>\)，有一个唯一的 \(\mathbf{x}=(x_1,...,x_n)\) 与之对应，\(x_i\) 表示债权人 \(i\) 获得的还款额，\(i=1,...,n\)
破产清偿问题满足 CG 性质的解存在且唯一
- CG：\(f(x_i+x_j,d_i,d_j)=(x_i,x_j),i,j=1,...,n,i\not=j\)

CG性质：将任意两位债权人所得的还款额之和按CG问题的解重新分配，每位债权人所得的还款额保持不变

CG问题的解：两组连通容器中水平面等高

存在性唯一性证明

存在性

向 n 组连通容器中注水，所有容器的水平面等高，即得一组解
任取两组容器，断开与其他各组容器的连接，将注入其中的水取出重注，注入每组容器中的水量不变

唯一性

对任一满足CG性质的解，将各组容器断开，向每组容器中注入相应的水量
为满足CG性质，任意两组容器的水平面等高，否则连通这两组容器重注后，容器中水量会有变化

情况枚举

稳定婚姻问题¶

\(n\) 名男士 \(m_1,m_2,...,m_n\) 和 \(n\) 名女士 \(w_1,w_2,...,w_n\)，每位男（女）士有一偏好顺序可对所有女（男）士按其满意度进行排序
\(n\) 个配对 \((m_{i_1},w_{j_1}),(m_{j_2},w_{j_2}),...,(m_{i_n},w_{j_n})\) 组成一组婚姻 \(\mathscr{M}\)，其中 \(i_1,i_2,...,i_n\) 和 \(j_1,j_2,...,j_n\) 是 \(1,2,...,n\) 的两个排列
若一组婚姻不存在不稳定组合，则称为稳定的
- 一婚姻 \(\mathscr{M}\) 称为不稳定的（Unstable）的，若存在不稳定组合 \(<m_i,w_l>,(m_i,w_j),(m_k,w_l)\in\mathscr{M}\)。但 \(w_j\prec_{m_i}w_j,m_k\prec_{w_l}m_i\)
给定所有男士和女士的偏好顺序，是否存在及如何求出一组稳定婚姻

每位男士都选择他最钟爱的女士
如果有女士被两位或者以上的男士选择，则这几位男士中除了她最喜欢的之外，对其他男士都表示拒绝
被拒绝的那些男士转而考虑他（们）的除被拒绝之外的最满意女士。如果存在冲突（包括和之前选择某女士的男士发生冲突），则再由相应的女士决定拒绝哪些男士
以上过程持续进行，直至不再出现冲突为止
欺骗：若使用“男士选择，女士决定”，女方可以通过提供虚假偏好获得更好的一组稳定婚姻

💬 评论

评论系统加载中...