科学研究

RESEARCH

当前位置: 首页 >> 科学研究 >> 学术观点 >> 正文
《博弈论理论与应用》短期课程(上)
2019年07月12日     浏览量:    


2019年6月4日至27日,中心邀请到了耶路撒冷希伯来大学教授Shmuel Zamir,为大家带来为期一个月的《博弈理论与应用》短期课程项目。Zamir教授于耶路撒冷希伯来大学获得数学博士学位,师从诺贝尔经济学奖得主R.Aumann,他的研究领域包括不完全信息博弈和重复博弈,是世界顶尖的博弈论学者。Zamir教授的短期课程旨在使同学们进一步了解博弈论的相关内容,夯实有关扩展式、策略式、占优、最大最小值、均衡等博弈论基础知识,且对行为策略、动态博弈、重复博弈等拓展内容有更为深刻的理解。

课程前半部分的主要内容如下:专题一介绍博弈论的基本知识,包括参与人、策略、支付、信息集等;专题二介绍如何使用扩展式和策略式刻画一个完整的博弈,并说明两者之间的关系,之后引入均衡的概念,掌握重复剔除劣策略的方法;专题三介绍最大最小策略的概念,从稳定性和安全性两种角度考虑博弈解的性质。专题四、专题五和专题六介绍在二人零和博弈的情况下应用最大最小值求得最佳混合策略的方法,并引入无差异原则、行为策略、均衡精炼等概念。

在第一个专题中,Zamir教授用几个简单生动的例子引入了博弈论的基本含义,并启发同学们博弈论作为一种工具在现实中可以怎样被使用。在夫妻纠纷例子中,通过设计一个博弈可以得出两人最好都雇佣一位优秀律师的结论;在囚徒困境例子中,两个被分别拘留的嫌疑人的占优策略都是坦白,但选择这一策略的收益是较差的;在公共交通困境例子中,通过计算博弈解可以得到公共交通工具的最佳选择。随后,Zamir教授给出了博弈的概念,包括参与人、策略、支付等基本要素。

 

在第二个专题中,Zamir教授引入了扩展式和策略式、有限博弈和无限博弈等概念,并重点介绍了 Von Neumann(1928)定理,即在任何完全信息的二人博弈中,如果结果集为{Ⅰ胜,Ⅱ胜,平局},那么以下三种情况只有一种成立:参与人Ⅰ有制胜策略;参与人Ⅱ有制胜策略;两个参与人都有至少保证平局的策略。接着,Zamir教授讲解了博弈均衡、占优等重要概念及其应用,并演示了如何重复剔除弱/严格被占优策略。关于剔除劣策略的顺序,Zamir教授指出,如果重复剔除博弈的过程中只有严格劣策略,那么博弈的结果不依赖于策略剔除的顺序。

 

在第三个专题中,Zamir教授首先强调了博弈论中非常重要的一对概念:占优与被占优。他指出,对于一对存在占优和被占优关系的策略,博弈参与者一般不会选择被占优的策略,特别在严格占优关系中,选择严格被占优策略被视作不理性的行为。接着,Zamir教授指出,纳什均衡实际阐述的是稳定性的概念,任何参与者都不存在有利可图的策略偏离。但是,尽管纳什均衡的稳定性逻辑很具有说服力,但其在一些情况下存在局限性,比如囚徒困境中的均衡。因此,在稳定性之外,还可以从安全性的角度来分析。随后,Zamir教授引入了“最大最小策略”的概念,即最大化自身在不同策略组合下可能获得的最小支付。当博弈参与者选择最大最小策略时,其得到一定的支付保障,这种保障不需要其他参与者的配合。最后,Zamir教授总结,稳定性和安全性是两个不同的性质,但二者又存在密切联系。

 

在第四个专题中,Zamir教授首先介绍了二人纯策略零和博弈最佳混合策略的计算方法,通过绘制参与人各自的收益函数,取相应的最大最小值和最小最大值,最终可得最佳策略,这种方法可以推广到其中一个参与人有任意数量纯策略的情况。接着,Zamir教授讲解了无差异原则,这是寻找到博弈均衡点的一个非常简便的方法。之后,Zamir教授指出,扩展式博弈和策略式的行为并不是一一对应的,通常,扩展式在细节上更为丰富,而策略式仅关注策略和结果,这导致博弈的“动态方面”不能表达出来。由此,Zamir教授引入了行为策略的概念,即参与人不是随机选择一个整体计划来决定他在整个博弈中的行动,而是在每个信息集上都会随机选择一个行动。最后,Zamir教授为同学们介绍了均衡精炼的概念。他指出,逆向归纳方法是寻找子博弈完美纳什均衡的有效方法,但在某些情况下,逆向归纳本身尚不足以描述理性行为。Zamir教授强调,逆向归纳实际上忽视了博弈已经到达了某个阶段,这个事实本身就已经提供了关于其他参与人行为的信息,因此也应该被考虑在内,这是一种正向归纳的思路。

Zamir教授的课程从博弈论的基础知识出发,通过数理证明和逻辑推演不断增加知识的广度和深度。在轻松愉快的氛围中,同学们不仅收获了宝贵的理论知识,还由此激发了进一步探究的强烈兴趣,为以后的学习打下了坚固基础。 

中心国际合作课程旨在搭建教师与学生高质量学术交流平台,开拓国际化视野,助力学生学术科研能力培养。为此,中心邀请了一系列国际顶级教授来教授前沿领域课程,包括由周雪光教授(斯坦福大学社会系主任,曾任清华大学社会学系兼职教授、香港科技大学商学院组织管理系主任,北京大学社会学系客座教授)带来的政府组织研究课程;由Shmuel Zamir教授(耶路撒冷希伯来大学教授,是不完全信息博弈和重复博弈相关领域的顶尖学者)带来的博弈论课程(不完全信息博弈);由Anil Deolalikar教授(加州大学河滨分校公共政策学院院长,经济学教授,加州大学全球健康研究所董事会主席,曾在华盛顿大学、宾夕法尼亚大学和哈佛大学任教)带来的公共理论研究课程;由Lorenz Hartmann(德国弗莱堡大学助理教授,毕业于埃克塞特大学,主要从事决策理论及博弈论研究)带来的决策理论课程等。

本课程项目由中央财经大学国际合作处引智项目支持。



撰稿:王玥宁