早期的游戏理论(Early Game Theory)是博弈论的起源阶段,主要出现在18世纪末到19世纪初,由约翰·纳什(John Nash)、弗雷德里克·哈特(Frederic Hatfield)、约翰·冯·诺伊曼(John von Neumann)等数学家和经济学家发展起来。这些理论奠定了现代博弈论的基础。
下面是一些早期游戏理论的关键概念和记法方法,帮助你理解并记忆这些内容:
一、核心概念
1. 博弈(Game)
- 定义:两个或多个玩家之间进行的互动活动,每个玩家有若干策略(行动)可以选择。
- 例子:两人博弈(如“囚徒困境”)、多人博弈(如“拍卖”)。
2. 策略(Strategy)
- 定义:玩家在博弈中可选择的行动或决策。
- 例子:在“囚徒困境”中,玩家可以选择“合作”或“背叛”。
3. 支付(Payoff)
- 定义:玩家在选择策略后所获得的收益或损失。
- 例子:在“囚徒困境”中,合作的支付是“-1”(双方都受惩罚),背叛的支付是“-3”(一方受惩罚,另一方得利)。
4. 均衡(Equilibrium)
- 定义:在博弈中,所有玩家都选择最优策略,且没有一方可以通过单方面改变策略来获得更好的结果。
- 例子:纳什均衡(Nash Equilibrium)是博弈论中最重要的均衡概念。
二、重要理论和模型
1. 纳什均衡(Nash Equilibrium)
- 定义:在博弈中,如果每个玩家的策略都是其他玩家策略的最优反应,那么这个策略组合就是纳什均衡。
- 记法:用符号表示为:
$$ (s_1, s_2, ..., s_n) \text{ 是纳什均衡,当且仅当 } s_i \text{ 是其他玩家策略的最优反应} $$
2. 囚徒困境(Prisoner's Dilemma)
- 定义:两个囚犯被分开审讯,他们可以选择合作或背叛。合作虽然对双方有利,但背叛可能带来更优结果,但两者都背叛时会受到更严重的惩罚。
- 记法:
- 合作(C):双方都受罚(-1)
- 背叛(D):一方受罚(-3),另一方得利(+1)
3. 零和博弈(Zero-Sum Game)
- 定义:一方的收益等于另一方的损失,总收益为零。
- 记法:
- 玩家A的收益 + 玩家B的收益 = 0
4. 完全信息博弈(Perfect Information Game)
- 定义:所有玩家都了解所有可能的策略和结果,且每一步都可选择所有可能的行动。
- 记法:
- 玩家知道所有可能的策略,且在每一步都有选择。
5. 完全随机博弈(Random Game)
- 定义:玩家的策略是随机选择的,没有明确的策略。
- 记法:
- 玩家策略是随机的,没有明确的“最优”策略。
三、记忆技巧
1. 用图示法记忆
- 绘制博弈树、支付矩阵、纳什均衡图等,帮助理解策略和结果之间的关系。
2. 用关键词记忆
- 纳什均衡:每个玩家都“最优反应”。
- 囚徒困境:合作是“最优”,但背叛更“有利”。
- 零和博弈:一方的收益等于另一方的损失。
- 完全信息:所有玩家都“知道”所有信息。
3. 用例子记忆
- 囚徒困境:两个囚犯的博弈。
- 拍卖:竞拍者的策略。
- 拍卖博弈:价格的博弈。
四、总结
| 概念 | 说明 |
|---|---|
| 博弈 | 玩家之间的互动 |
| 策略 | 玩家可选的行动 |
| 支付 | 玩家获得的收益或损失 |
| 均衡 | 玩家策略的最优反应 |
| 纳什均衡 | 最优反应的策略组合 |
| 囚徒困境 | 合作不如背叛,但双方都受惩罚 |
| 零和博弈 | 一方收益等于另一方损失 |
| 完全信息 | 所有玩家都了解所有信息 |
五、练习题(帮助记忆)
-
在“囚徒困境”中,如果双方都选择“合作”,结果是什么?
- A. 两者都受罚
- B. 一方受罚,另一方得利
- C. 两者都得利
- D. 两者都得利,但更严重 ✅ A
-
在纳什均衡中,每个玩家的策略是其他玩家策略的:
- A. 最优反应
- B. 最优选择
- C. 最优策略
- D. 最优结果 ✅ A
如果你需要,我也可以帮你把这些内容整理成思维导图或者记忆卡片,方便你复习和记忆。需要的话告诉我!