教育教学

当前位置: 首页 >> 教育教学 >> 精品课程 >> 正文
《博弈理论与应用》短期课程(下)
2019年07月12日    编辑:    浏览量:    

2019年6月4日至27日,中心邀请到了耶路撒冷希伯来大学教授Shmuel Zamir,为大家带来为期一个月的《博弈理论与应用》短期课程项目。Zamir教授于耶路撒冷希伯来大学获得数学博士学位,师从诺贝尔经济学奖得主R.Aumann,他的研究领域包括不完全信息博弈和重复博弈,是世界顶尖的博弈论学者。本次课程从基础的概念开始讲授,使学生首先理解博弈中常常提及的参与人、支付、策略集、信息集等概念和含义,之后学生们将学习掌握如何用标准的形式来刻画一个完整的博弈,并进一步学习利用占优、均衡和最大最小等方法求解博弈的结果。在此基础上,课程将做进一步延伸和拓展,包括从静态博弈到动态博弈,从完全信息下的博弈到不完全信息下的博弈,从单期博弈到多期博弈等。

短期课程后半部分的课程大纲组织如下:专题七介绍了均衡博弈;专题八介绍了重复博弈;专题九介绍了不完全信息博弈和共同先验知识。

在专题七中,Zamir教授讲解了均衡博弈的相关内容。在非合作博弈中,最重要的解的概念是纳什均衡。当博弈具有多个纳什均衡时,我们有时想知道哪些均衡更合理。本节课上,大家学习了纳什均衡概念的一些精炼。这个精炼背后的思想是,排除不可置信的威胁,即偏离均衡路径的“非理性”行为,其目的是阻碍这种偏离。在完全信息博弈中,子博弈完美均衡永远存在,可以用逆推法找到。

在专题八中,教授讲解了重复博弈模型。在一次博弈中,参与人之间的互动只发生一次,一旦完成,它对参与人之间以后的互动都是没有影响的。一个重复博弈包括了一个基础博弈,这是一个策略式博弈,然后这个博弈被有限次或者无限次地重复,即参与人一次又一次地参加简单基础博弈。老师给出了这个模型的变形——有限次重复博弈,每个参与人试图最大化其平均收益。重复博弈的构建来自于基础博弈,根据定义,策略告诉参与人在整个博弈中如何选择,并以此为基础给出T阶段重复博弈的定义。基于此博弈,我们的目标是,随着T趋于无穷大,刻画均衡收益集的极限。对于均衡收益集中的每个向量x,对每个足够大的自然对数T,我们将构建T阶段重复博弈均衡,它带来的收益接近x。我们假定:参与人集合、参与人的可选行动和他们的收益函数随着时间而改变,且独立于过去的行动。然而这个假定具有高度的局限性,在现实中往往很难得到满足。对于重复博弈模型,然后进行了无名氏定理的证明:在一些技术条件下,均衡收益集合是(或近似是)基础博弈的可行且个体理性的收益集。无名氏定理(Folk Theorem)即在重复博弈中,只要博弈人具有足够的耐心(贴现因子足够大),那么在满足博弈人个人理性约束的前提下,博弈人之间就总有多种可能达成合作均衡。存在无穷多对有限自动机策略,可以成为无限重复博弈的平衡点,并同时实现双方的合作。无名氏定理之所以得名,是由于重复博弈促进合作的思想,早就有很多人提出,以致无法追溯到其原创者,于是以“无名氏”命名之。接着,Zamir教授引入添加了惩罚措施的重复囚徒困境博弈的例子,并介绍了T阶段重复博弈。在这部分中研究了一个T阶段的重复博弈,目标是描述T趋于无穷时的均衡集合。在这部分,教授详细了两个重要的概念——“历史”和“策略”。由于玩家在重复的博弈中不断地遇到彼此,他们会随着博弈的进展而收集信息。

在专题九中,Zamir教授首先给出了奥曼(Aumann)的不完全信息模型,奥曼模型化的是,在所面对的情形下,参与人关于与收益相关的知识。教授介绍了知识运算符、共同知识的概念,刻画事件的集合,也就是参与人之间的共同知识等定义。共同知识指的是,事实F在博弈的参与人之间是共同知识,如果所有的参与人知道F,所有的参与人知道所有的参与人知道F,所有的参与人知道所有的参与人知道所有的参与人知道F,等等(对任何有限阶推理均成立)。然后,在模型中加入关于信念的概念,并引出了知识的无限层级,在不完全信息博弈中,知识和信念的这两个概念是密切交织的,但出于简化考虑,我们先考虑知识的层级,然后考虑信念的层级。最后,大家学习了奥曼同意定理的证明:如果参与人对特定事件的概率没有达到一致,那么就不构成参与人之间的共同知识。另外,教授还讲授了奥曼同意定理、海萨伊模型、不完全信息博弈的均衡等知识。奥曼同意定理说明,如果两个参与人开始的时候,“对这个世界拥有相同的信念”,但收到的是不同的信息,那么“它们不会形成‘求同存异’的情况”。在研究不完全信息的奥曼模型中,集中关注的是真实状态下的共同知识和共同信念等概念;在不完全信息博弈的模型中,参与人不确切知道参加了哪个博弈。在这种情况下,自然状态包括与收益有关的所有参数,即每个人参与人的行动集及其收益函数。Zamir教授举例说明了海萨伊提出的模型对一个例子的刻画,也就是不完全信息海萨伊博弈,然后讲解了海萨伊博弈的定义。不完全信息海萨伊模型可以在两个不同的时点上进行分析(在事前阶段参与人知道自己的类型之前,和在事中阶段参与人知道自己的类型之后),相应地,两类不同的均衡得以定义。第一个均衡概念是海萨伊博弈的纳什均衡,提出的要求是,在知道自己的类型之前,没有人能从单方面偏离均衡中获益。第二个均衡概念是贝叶斯均衡,提出的要求是,在知道了自己的类型后,没有参与人能在事中阶段从偏离均衡中获益。

在本次短期课程中,Zamir教授采用讲练结合的方式,不但从理论方面详细讲解了博弈理论,同时热情鼓励同学们自主思考,解题练题,就课程内容中提到的案例和应用展开热烈讨论。大家在轻松愉快的课堂氛围中学习理论知识,扎实掌握博弈理论与应用,最后课程在阵阵掌声中圆满结束,现场师生与Zamir教授合影留念。

中心国际合作课程旨在搭建教师与学生高质量学术交流平台,开拓国际化视野,助力学生学术科研能力培养。为此,中心邀请了一系列国际顶级教授来教授前沿领域课程,例如,由周雪光教授(斯坦福大学社会系系主任,曾任清华大学社会学系兼职教授、香港科技大学商学院组织管理系系主任,北京大学社会学系客座教授)带来的政府组织研究课程;由Shmuel Zamir教授(耶路撒冷希伯来大学教授,是不完全信息博弈和重复博弈相关领域的顶尖学者)带来的博弈论课程(不完全信息博弈);由Anil Deolalikar教授(加州大学河滨分校公共政策学院院长,经济学教授,加州大学全球健康研究所董事会主席,曾在华盛顿大学、宾夕法尼亚大学和哈佛大学任教)带来的公共理论研究课程;由Lorenz Hartmann(德国弗莱堡大学助理教授,毕业于埃克塞特大学,主要从事决策理论及博弈论研究)带来的决策理论课程等。

本课程项目由中央财经大学国际合作处引智项目支持。




撰稿:邓导