书籍详情
博弈学习理论
作者:(美)朱·弗登伯格(Drew Fudenberg),(美)戴维·K.莱文(David K.Levine)著;肖争艳,侯成琪译;肖争艳译
出版社:中国人民大学出版社
出版时间:2004-07-01
ISBN:9787300057477
定价:¥32.00
购买这本书可以去
内容简介
在经济学中,绝大多数的非合作博弈理论集中研究博弈中的均衡问题,尤其是纳什均衡及其精炼。对均衡什么时候出现以及为什么均衡会出现,传统解释是,均衡是在博弈的规则、参与人的理性以及参与人的支付函数都是共同知识的情况下,由参与人的分析和自省所得出的结果。不论是在概念上还是在实证上,这个理论都存在许多问题。在《博弈学习理论》一书中,朱·弗登伯格和戴维·K·莱文提出了另一种解释:均衡是并非完全理性的参与人随时间的推移寻求最优化这一过程的长期结果。他们研究的模型为均衡理论提供了基础,并为经济学家评价和改进传统的均衡概念提供了有用的方法。
作者简介
朱·弗登伯格是哈佛大学的经济学教授。黛维·K·莱文是加利福尼亚大学洛杉矶分校的经济学教授。相关图书策略思维:商界,政界及日常生活中的策略竞争经济学与消费者行为
目录
第1章 引论
1.1 前言
1.2 大群体模型和匹配模型
1.3 三个常用的学习和/或进化模型
1.4 库诺特调整
1.5 库诺特动态分析
1.6 具有锁定功能的库诺特过程
1.7 回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章 虚拟行动
2.1 引言
2.2 两人虚拟行动
2.3 虚拟行动中的渐近行动
2.4 对虚拟行动中循环的解释
2.5 多人虚拟行动
2.6 虚拟行动的支付
2.7 两战略博弈中的一致性和相关均衡
2.8 虚拟行动和最优反应动态
2.9 虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章 模仿者动态和相关的确定性进化模型
3.1 引言
3.2 同质群体中的模仿者动态
3.3 同质群体模仿者动态的稳定性
3.4 进化稳定战略
3.5 非对称模仿者动态模型
3.6 对模仿者动态方程的解释
3.7 模仿者动态的一般化和重复剔除严格劣战略
3.8 短视调整动态
3.9 集值极限点和漂移
3.10 廉价磋商和秘密握手
3.11 离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章 随机虚拟行动和混合战略均衡
4.1 引言
4.2 收敛的概念
4.3 渐近短视和渐近经验主义
4.4 随机扰动支付与平滑最优反应
4.5 平滑虚拟行动和随机逼近
4.6 部分抽样
4.7 普遍一致性和平滑虚拟行动
4.8 刺激反应和作为学习模型的虚拟行动
4.9 对战略空间的学习
附录:随机逼近理论
参考文献
第5章 具有持续随机性的调整模型
5.1 引言
5.2 回顾随机调整模型
5.3 坎多里迈拉斯罗布(Kandori Mailath Rob)模型
5.4 讨论其他动态
5.5 局部相互作用
5.6 吸引域的半径和协半径
5.7 修正的协半径
5.8 具有异质群体的一致随机匹配
5.9 随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章 扩展式博弈和自确认均衡
6.1 引言
6.2 一个例子
6.3 扩展式博弈
6.4 一个简单的学习模型
6.5 自确认均衡的稳定性
6.6 异质的自确认均衡
6.7 一致自确认均衡
6.8 一致自确认均衡与纳什均衡
6.9 可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章 纳什均衡,大群体模型和扩展式博弈中的变异
7.1 引言
7.2 相关信息集和纳什均衡
7.3 外生试验
7.4 在被比做吃角子老虎机问题的博弈中的学习
7.5 定态学习
7.6 “快速学习”模型中的随机调整和后向归纳
7.7 廉价磋商博弈中的变异和快速学习
7.8 试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章 老练学习
8.1 引言
8.2 条件学习的三个范例
8.3 老练学习的贝叶斯方法
8.4 绝对连续条件的解释
8.5 选择专家
8.6 条件学习
8.7 折现
8.8 分类策略和循环
8.9 内省的分类规则,校准和相关均衡
8.10 模式识别中的索斯诺模型
8.11 操纵学习程序
参考文献
索引
1.1 前言
1.2 大群体模型和匹配模型
1.3 三个常用的学习和/或进化模型
1.4 库诺特调整
1.5 库诺特动态分析
1.6 具有锁定功能的库诺特过程
1.7 回顾同时行动有限博弈
附录:动态系统和局部稳定性
参考文献
第2章 虚拟行动
2.1 引言
2.2 两人虚拟行动
2.3 虚拟行动中的渐近行动
2.4 对虚拟行动中循环的解释
2.5 多人虚拟行动
2.6 虚拟行动的支付
2.7 两战略博弈中的一致性和相关均衡
2.8 虚拟行动和最优反应动态
2.9 虚拟行动的一般化
附录:狄利克雷先验和多项抽样
参考文献
第3章 模仿者动态和相关的确定性进化模型
3.1 引言
3.2 同质群体中的模仿者动态
3.3 同质群体模仿者动态的稳定性
3.4 进化稳定战略
3.5 非对称模仿者动态模型
3.6 对模仿者动态方程的解释
3.7 模仿者动态的一般化和重复剔除严格劣战略
3.8 短视调整动态
3.9 集值极限点和漂移
3.10 廉价磋商和秘密握手
3.11 离散时间模仿者系统
附录:刘维尔(Liouville)定理
参考文献
第4章 随机虚拟行动和混合战略均衡
4.1 引言
4.2 收敛的概念
4.3 渐近短视和渐近经验主义
4.4 随机扰动支付与平滑最优反应
4.5 平滑虚拟行动和随机逼近
4.6 部分抽样
4.7 普遍一致性和平滑虚拟行动
4.8 刺激反应和作为学习模型的虚拟行动
4.9 对战略空间的学习
附录:随机逼近理论
参考文献
第5章 具有持续随机性的调整模型
5.1 引言
5.2 回顾随机调整模型
5.3 坎多里迈拉斯罗布(Kandori Mailath Rob)模型
5.4 讨论其他动态
5.5 局部相互作用
5.6 吸引域的半径和协半径
5.7 修正的协半径
5.8 具有异质群体的一致随机匹配
5.9 随机模仿者动态
附录A:有限马尔可夫链的回顾
附录B:随机稳定分析
参考文献
第6章 扩展式博弈和自确认均衡
6.1 引言
6.2 一个例子
6.3 扩展式博弈
6.4 一个简单的学习模型
6.5 自确认均衡的稳定性
6.6 异质的自确认均衡
6.7 一致自确认均衡
6.8 一致自确认均衡与纳什均衡
6.9 可理性化的自确认均衡和关于对手支付的先验信息
参考文献
第7章 纳什均衡,大群体模型和扩展式博弈中的变异
7.1 引言
7.2 相关信息集和纳什均衡
7.3 外生试验
7.4 在被比做吃角子老虎机问题的博弈中的学习
7.5 定态学习
7.6 “快速学习”模型中的随机调整和后向归纳
7.7 廉价磋商博弈中的变异和快速学习
7.8 试验和期限的长度
附录:吃角子老虎机问题回顾
参考文献
第8章 老练学习
8.1 引言
8.2 条件学习的三个范例
8.3 老练学习的贝叶斯方法
8.4 绝对连续条件的解释
8.5 选择专家
8.6 条件学习
8.7 折现
8.8 分类策略和循环
8.9 内省的分类规则,校准和相关均衡
8.10 模式识别中的索斯诺模型
8.11 操纵学习程序
参考文献
索引
猜您喜欢