时间:2023-08-21 16:58:22
序论:在您撰写博弈论方法时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
关键词:博彝论公选课;教学内容与方法改革;措施
中图分类号:G420 文献标志码:A 文章编号:1002-0845(2012)01-0042-03
博弈论是当代西方经济学体系中最重要的理论课之一,其应用前景非常广泛。几乎所有社会科学领域中都活跃着与博弈论交叉的分支学科,为满足当代大学生对博弈论知识的需求,高校加强博弈论公选课建设迫在眉睫。鉴于此,笔者面向全校开设了“博弈论与诺贝尔经济学奖”和“博弈问题及其启示”两门通识选修课程。
一、博弈论公选课教学中存在的问题
由于博弈论与经济学、管理学和数学等学科有着十分密切的关系,所以国内本科院校的博弈论课程主要面向经济、金融、管理或数学专业开设,教学的对象通常是本专业或本学科相关专业的学生,很少面向全校开设公选课,这主要缘于以下两个方面的原因:第一,博弈理论的建立只有六七十年的历史。国内高校博弈论课程开设时间最长的也不到十年,上述情况导致了课程建设的经验不足、水平不一。第二,研究博弈理论往往需要借助数学的方法,所以,博弈论课程的讲授与学习离不开数学工具和经济学知识,课程内容不得不受制于较高的知识门槛。因而,国内博弈论公选课的建设尚处于起步阶段。
笔者在连续四个学期开设博弈论公选课后发现,该课程教学中存在的主要问题如下:
1 学生问的差异较大
由于博弈论公选课面对的本科生纵跨二、三、四三个年级。横跨本校全部学科的所有专业,导致学生的认知平台和知识面存在较大差异,学习目的和价值取向呈现出多元性,学生在学习态度、学习习惯和学习能力方也存在较大差别。
2 理论学习需要有一定的经济学基础和数学基础
博弈论是从经济学的角度提炼出个体最优决策问题后,利用数学模型对其进行描述,再运用数学工具对其理论进行研究。2007年的诺贝尔经济学奖得主罗杰・迈尔森(Roger B.Myerson)认为,“博弈论是对理人或决策者之间相互冲突及合作的数学模型进行的研究”。虽然博弈论具有广泛的应用范围和较强的解释能力。但它的标准表达是函数形式和集合论形式的,研究方法和分析过程依赖于数学工具。所以,学习博弈论既要有相关的经济学知识,又要有一定的数学基础。正因如此,学生在公选课中接触博弈论时会觉得比较抽象。
3 课程的知识容量受限
为了照顾学生差异,笔者在教学过程中会尽可能详细地为学生进行讲解,因而不得不压缩知识的容量,这导致了一部分经济学和数学基础较好的学生“吃不饱”的问题。笔者尝试通过布置课后练习的办法来解决这一问题,但效果不是很明显。或许一个不可回避的重要原因是,有限的课余时间和较快的学习节奏限制了多数学生对公选课知识的进一步学习。
4 缺少合适的教材
缺少合适的教材也是博弈论公选课教学中存在的主要问题之一。笔者认为,博弈理论的应用性和公选课内容的时效性是激发学生学习兴趣的、切入点,教材的编写应将二者有机结合起来,方能发挥最大的功效,然而目前的教材往往只能体现前者却难以涵盖后者。
二、课程内容与教学方法改革的措施
1 抓住学生的共性
大学生具有强烈的关注现实问题的意愿,对社会热点问题表现出极高的兴趣,尤其在理解焦点问题时具有很强的可塑性和认知共性。因而应牢牢抓住这一共性,迎合学生在知识需求上的实用化和功利化的特点,从当前丰富的信息资源中寻找承载博弈论知识的现实问题,以期收到事半功倍的教学效果。在教学实践中,笔者把丰田汽车赔偿、西南五省大旱、相亲类节目“非诚勿扰”、2008股市大跌等现实热点都搬上了讲台。下面,笔者就通过教学实例进行说明。
在讲授2005年诺贝尔经济学奖得主托马斯・谢林(Thomas C.Schelling)的博弈承诺及其可信性概念时,笔者以制定《反国家分裂法》为典型案例进行分析。由于祖国统一问题是所有国人关心的国家大事,大学生也不例外,所以讲授过程非常顺利,以致学生在课后反馈中把这一案例列为讲授最成功的部分。接着,为了讲解如何应用可信承诺处理现实问题,笔者选择了电视连续剧《老大的幸福》第四集中的一个视频片段,进一步强化了知识点。实践证明,人物生动的形象在给课堂增添活跃气氛的同时,也很好地承载了传递知识的作用,以缩影的形式把可信承诺的概念和应用可信承诺策略的方法植入了学生的头脑中。最后,笔者以拆迁补偿合同签订中的一种可信承诺策略为例,对本节课进行了总结,并请学生加以点评。由于拆迁问题是当前社会的焦点问题,所以学生对点评表现出极大的兴趣。这样,通过抓住学生的认知共性,展示了可信承诺策略在焦点问题上能够将劣势变为优势的强大作用,成功地引导学生了解并掌握了博弈承诺及其可信性概念。
2 增强主题的典型性和知识模块的简洁性
以经典博弈问题为主题有利于组织素材、选择教学内容;简洁地安排知识模块、弱化知识的层次性有利于照顾各类学生在知识面、综合能力和认知水平上的差异;少而精地选择课程内容有利于突出重点;多角度地反复讲解有利于降低知识门槛,提高学习的效果。
例如,在主题选择上,笔者以多数学生熟知的“囚徒困境”作为第一主题;以试验性强、易于展开的“理性基础和有限理性”作为第二主题;以现实性突出的“重复动态博弈”作为第三主题。由于“囚徒困境”与经济学中的“理性人假设”密不可分,所以第一主题既能让学生感受到博弈问题的趣味性和深刻性,又能激发他们对该主题的进一步思考,使他们逐渐认识到“理性人假设”所具有的超越现实、过于理想的特性,从而部分地为第二和第三主题做好铺垫。另外,有大量关于“囚徒困境”和理性问题的课外资料易于获得,这为学生在课程初期进行兴趣驱动的导读创造了条件。
在知识模块设置上,笔者采取“自成模块、减少关联”的策略。例如,针对非常重要的“信息不对称”主题,我们选择了以二手车市场为核心,构建了包含药品市场、电脑市场和就业市场等典型主题的知识模块。一方面,这些市场为学生所熟知,易于接受;另一方面,这些市场中包含着非常典型的“信息不对称”因素,因而通过对市场现象的自然描述完全可以弱化学生对经济学市场知识的依赖。为了弱化知识的层次性,突出重点内容,笔者舍弃了理论体系中的某些知识模块,例如“海萨尼转换”、“斯宾塞信号传递模型”和“斯蒂格利茨信息甄别模型”等。
3 重视案例应用,尤其应重视与诺贝尔经济学奖得主有关的案例
博弈论有一个显著特点,那就是它“声名显赫”,并且与
诺贝尔经济学奖的关系密切。许多诺贝尔经济学奖得主都曾涉足博弈论领域,在博弈论的建立和发展中直接或间接做出过贡献。“名声在外”为博弈论公选课的开设提供了有利条件,也为课程的讲授提供了独特的视角和丰富的素材。正因如此,笔者才面向全校开设了博弈论与诺贝尔经济学奖公选课。下面,以1994年诺贝尔经济学奖得主约翰・福布斯・纳什(John Forbes Nash Jr.)为例,详细说明如何应用与诺贝尔经济学奖得主有关的案例以及这样做的优点。
纳什是博弈理论发展的划时代人物,纳什均衡是博弈论的核心概念,两者都是公选课中必须包含的内容。为此,笔者设计了以下三个环节:1)借助“囚徒困境”和“情侣博弈”讲授纳什均衡及其不唯一性;2)播放电影《美丽心灵》,并进行讨论和点评;3)布置以纳什为主题的案例设计作业,让同学在课堂上演讲。第一部分是讲解的重点,讲好纳什均衡意味着博弈论课程成功了一半。第二部分可以把人格培养和素质教育有效融合起来。《美丽心灵》不仅能让人体悟到学生心灵中因爱而生的温暖,还能给出人生原本就是一场博弈的警示,体现出“大人物小故事”的精髓。纵然纳什这样的天才也有无法摆脱的困境,何况他人?所以,在人生的博弈中,既要承认能力的差异,又要找寻属于自己的色彩。同时还应看到,纵然如纳什般为顽疾所缠都可以逐渐康复,何况其他挫折?所以,要以积极、乐观、健康的心态对待人生,要终身学习而不轻言放弃!第三部分是对学生的启发环节。该环节不仅要培养学生对本课程的兴趣,加深学生对知识的理解,还要通过为其提供上台演讲、展示成果的机会,锻炼他们的逻辑思维能力和表达能力。值得一提的是,很多学生在设计案例时自学了有名的“智猪博弈”和“恋爱博弈”等经典模型,巩固了纳什均衡概念,还有学生甚至对纳什曾经设计过的一种“六连棋”博弈游戏(笔者对此也知之甚少)进行了分析。
4 重视学科交叉,尤其应重视学科交叉视阙下的学术前沿成果
博弈论已逐渐成为一门为诸多学科提供思维方法和分析技巧的学问,可以说,所有与生命有关的学科都蕴藏着博弈论的应用空间。在公选课中,应重视从学科交叉的视角供给知识,广泛培养各专业学生对课程的兴趣。例如,笔者选择生物演化理论和博弈论交叉所产生的演化博弈论作为知识模块,以人类社会的同性恋演化作为典型主题,挑选最前沿的学术研究案例作为教学的主要内容为学生进行讲解,扩展了学生的知识面。
在演化博弈论的开创性著作《演化与博弈论》一书中,作者约翰・梅纳德・史密斯(JohnMaynardSmith)用精妙的语言、深入浅出的分析和丰富有趣的案例把博弈论的思想融入到生物演化中,推动了对“动物为什么如此”这一问题的深入研究,揭示了动物群体行为演变的动力学机制。笔者首先以“哺乳动物一雄多雌”案例作为引导,简单介绍演化博弈论在性选择和性别比问题上的研究视角以及逻辑结构,然后立刻引出了人类面临的一个有关性的问题――同性恋演化主题下的性问题:从进化论的角度来看,男男同性恋的存在完全没有任何意义,这是因为同性恋相比于异性恋而言成功繁殖后代的可能性太小,那么为什么同性恋的基因没有被淘汰?显然,这一问题接近现实热点,对学生极具诱惑力,而且还具有很强的学术延伸性。为了讲解同性恋基因延续的演化博弈机制,笔者借助2010年2月24日美国心理科学杂志上发表的关于萨摩亚岛上男男同性恋的最新研究成果,利用最前沿的学术案例详细分析了“亲族选择”假说下的演化博弈机制。教学实践表明,通过这样的内容设计,来自不同专业的学生的学习兴趣都被调动起来,加深了他们对博弈论的理解,顺利实现了教学的目标。
5 重视开放性,尤其应重视教学信息交流反馈的开放性
信息交流有利于帮助学生巩固所学内容,让有兴趣的学生通过查阅相关资料,获得知识上的感悟和能力上的提升,并逐步脱颖而出。信息反馈有助于教师突出教学的亮点,发现教学中存在的不足,以便在今后的教学中加以改进。
教学实践中,笔者让学生通过电予邮件的形式反馈“课堂心得”,并要求他们回答以下三个问题:
(1)这次课对你影响最深或最成功的是哪部分?
(2)最失败或可有可无的又是哪部分?
(3)对本次课你有什么意见和建议?
这三个问题一方面可以督促学生对课堂内容加以回顾、梳理,另一方面,又可以从中发现笔者在教学中存在的不足之处。事实上,在交流和反馈中,许多同学都针对课程的内容、进程和教师的教学习惯、技能等提出了中肯的批评和建议,帮助教师提高教学水平。这些批评和建议包括“讲课的速度有点偏快”、“思考时间较少”、“有些理论过于深奥”、“希望针对时事展开分析”、“希望多些互动”、“理论是需要加强的”等,当绝大多数学生赞成“少一点数学知识”并希望“讲得详细点”时,笔者采纳了这一建议,并列出了几本偏重数学工具的参考书让那些“吃不饱”的学生自学。
学生给予的温馨鼓励也让笔者感觉“很给力”。例如,“本节课内容很充实,希望老师保持下去”、“老师的努力我们都看到了,希望老师以后做得更好”等话语激励着笔者,使笔者能够维持浓厚的教学热情使其永不衰减,并且有信心进一步提高自身的专业能力,挑战自我的职业水平。
教学探索与实践的过程是循序渐进的过程,学生在这一过程中所起到的作用是巨大的。只要教师能够及时、充分地了解学生的需求,不断总结、深化课程教学改革的经验,就一定能取得更大的成效。
三、下一步的设想
笔者秉承“以人为本,以学生的发展为中心”的教育理念,希望博弈论公选课能为学生打开“半”扇窗,培养他们对博弈理论的兴趣,激发学生课后自主学习的潜能,做到既为学生提供基本知识,又帮助学生脱颖而出。
教学实践表明,的确有不少学生通过自主学习脱颖而出。以下是某学生的反馈:“最近看了一本《博弈三国》,该书用博弈论的方式对三国故事进行解析,感觉博弈论有一种奇妙的功能,就是能把复杂问题简单化,而且解析后的过程、缘由都一清二楚了。”更有学生觉得自己“在研究中发现了对自己有用的东西,受益匪浅”。也有在深入思考后对教学内容提出反诘者:“从平常感知上来说,同性恋的基因遗传与博弈基本无关……博弈是一种研究竞争参加者为争取最大利益应当如何做出决策的数学方法……无法说这样一种与母系基因联系较为紧密的基因遗传行为可以用博弈的方式去解决,只能说同性恋的基因遗传在某种程度上体现了社会的平衡态。”不管这些反馈的具体情境如何,它们至少说明,应从公选课的现实性、延伸性、前沿性和开放性出发,强化学生的共性。弱化学生的差异性,充分利用教学内容的充实性和教学方法的灵活性,谨慎且大胆地进行教学改革,为满足高等教育通识选修课的教学需求,进一步提高教学的水平与质量,提供一些思路和经验。
纳什均衡是现代博弈论中的核心内容和重要基础,许多理论研究和应用都是围绕这一基本理论展开或与此相关的。随着博弈论的发展和博弈研究的不断深入,人们意识到这种理论和日常经济生活的联系越来越紧密。博弈论可以揭示众多经济问题内在规律和根源,帮助人们分析经济关系,认识经济现象,评判经济效率,指导人们进行科学的经济决策,无论对企业等实际经济部门的经营活动,还是对政府的管理和政策制度制定,博弈论都有重要的指导意义。要用博弈论解决现实经济中的决策问题,就必须解决博弈模型的理论抽象和架设与经济问题实际情况的差距等问题,而解决这些问题的关键在于如何运用数模的思想抽象出问题中的得益矩阵。本文在博弈论的核心内容纳什均衡的基础上,介绍了纯战略纳什均衡和混合战略纳什均衡的相关理论,针对日常生活中的污水排放问题进行了分析。
二、纳什均衡在经济生活中的具体运用――污水排放问题
博弈的分类方法是多种多样的。根据参与人的多少,可将博弈分为二人博弈和多人博弈;根据参与人是否合作,可将博弈分为合作博弈和非合作博弈;根据博弈结果的不同,又可分为零和博弈、常和博弈与变和博弈。一般地,将不允许存在有约束力协议的博弈称为“非合作博弈”,与此相对,允许存在有约束力协议的博弈称为“合作博弈”。“纳什均衡”是非合作博弈理论中最重要的一个解概念。政府应该怎样治理污水排放是当今一个热点,也是本文所探讨的问题。政府和企业之间的关系可以运用经济学上的监督博弈来处理。
这个博弈的参与人包括政府和企业,政府的战略选择是检查或不检查,企业的战略选择是排污或不排污。假设A1是企业治理污水(不排污)所增加的生产成本,如果排污的话,则可以将A1据为所有;A2是政府检查所需成本;W是政府对企业排污所收取的罚款金额;G是企业排污所造成的污染而对社会利益的损害;假设W>A1,且W>A2+G,即政府对排污企业采取重罚措施。下表即为一个对应不同战略组合的得益矩阵。
在得益矩阵中,用p代表检查排污的概率,β代表企业排污的概率。给定p,政府检查(p=1)和不检查(p=0)的期望分别为:
E(1,β)=(W-A2-G)γ+(-A2)(1-β)=(W-G)β+A2
E(0,β)=-Bβ+0(1-β)=-Bβ
由E(1,β)=E(0,β),得β*=A2/W。可以采取两种举措:
采取重罚措施;即降低检查成本A2。另外,给定政府检查的概率θ,企业选择排污(β=1)和不排污(β=0)的期望收益分别为:
E1(p,1)=(A1-W)p+C1(1-p)=A1-W・p
E1(p,0)=0
由E1(P,1)=E(P,0)得P*=A1/G,即在现实经济中有许多企业和企业排污所取得的罚款金额W有关,对排污的惩罚越重,企业因排污所获得的生产成本越少,企业的排污概率就越小。
实际上,政府在治理企业排污的时候,应设法考虑收益权的收益问题。由于国民待遇的要求,不可能因企业性质不同而采取不同的罚款数量。所以解决这个问题只能采用行政手段。
同时也要注意地方政府在治理污水中的角色。首先,地方政府的行为要受制于中央政府既定的制度。其次,地方政府亦可亲自组织创新或担当起制度创新的重任。最后,地方政府是制度的推行维护者,对违法排污者实施重罚。
三、主要结论和后续工作展望
[关键词]博弈论;理性人假定;公共知识;社会科学方法论
[中图分类号]C3
[文献标识码]A
[文章编号]1671-511X(2012)04-0020-03
博弈论是研究理性人的互动的理论,或者说研究交互决策的理论。1928年,冯·诺依曼证明了博弈论的基本原理,宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统应用于经济领域,奠定了这一学科的基础和理论体系。1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚定的基础。塞尔顿、哈桑尼、谢林、奥曼等人的研究也大大推动了博弈论的发展。因此,尽管博弈论是一门新生的学科,但是它今天已经发展成为有较完善的理论体系的科学。
今天,博弈论已经成为社会科学的通用方法论。尽管它是演绎科学,对社会现象有强大的解释力,然而,由于其理想主体的假定使得其演绎出的理论解与实际博弈结果存在差异。许多实验经济学家通过博弈实验研究实际中人们的博弈过程,分析博弈论的演绎解与博弈实验结果之间的差异。如2002年诺贝尔经济学奖就颁发给了丹尼尔·卡尼曼和迈农·史密斯,他们是实验经济学的先驱。今天在西方学术界通过实验来验证博弈的理论结果已经成为一种潮流。本文下面设计并进行了一个博弈实验,通过分析实验结果与理论解的差异,分析博弈论作为社会科学方法论的局限性,并提出改进的可能路径。
一、博弈实验及结果分析
1 实验描述
我们设计了如下的一个博弈实验。该实验的参与人是南京大学选修文化素质课“逻辑与科学方法基础”的大学生,他们是二三年级的学生,文理科学生均有。
该实验是以试题的形式进行的,该试题作为期末试卷中的最后一道题。该题目为:
在0-100之间选择一个数字,规则是:若你选择的数字“是或最接近”在座同学所选择的数字的平均数的2/3(即在座同学所选数的总和除以总人数之后所得数字的2/3,如:若平均数为90,你应当选2/3×90=60),你将获胜。请给出你选择的理由。
实验说明:
(1)实验参与者即参加考试的学生,事前不知道这是一个实验;
(2)该课程教师以讲座的形式给实验参与者传授过博弈论知识,但没有提到所进行的博弈;
(3)因为(2),他们中的大多数掌握“博弈”、“公共知识”等概念;
(4)试卷是保密的,没有任何学生预先知道考试内容,考试过程中学生间无任何交流;
(5)该博弈的理论解(即纳什均衡)为0或1。
2 实验结果
对于考试中的每个学生,在这个博弈实验中他能够获胜的关键是,他要准确猜测他人是如何选择的,一旦他猜测正确,他将他猜测的平均数乘以2/3便是获胜答案。
共有176人参加了考试。排除掉5个不明确的选择,供分析的实际选择数为171个(其中3个选择非整数)。实验结果为(按照数字大小排序):
“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。
3 结果分析
在这些所选择的数字中,最大的数字为75,最小的数字为0。171个数字相加后的平均数为21.91,本博弈胜出解:21.84×2/3=14.61。
这个博弈中,0和1是均衡解(下一部分将分析),它们是“理论解”。在该实验中,0是所选最多的数字,共有46人选择,比例为26.9%;选1的为14人,比例为8.2%。两者相加共有60人,比例为35.1%。
从上述数据可以看出,在这场博弈中,“实验解”为14.61,最接近该数的是14或15,这和“理论解”的“0”或“1”不同。在本实验中,没有人选择14,而选择15的有3人,这3人是该实验的胜出者。
若按照区间来统计,实验结果的分布情况见表1。本博弈实验的“实验解”14.61落在11-20之间。若我们把11-20看成是胜出区间,则有7人胜出。
对于这些选择,有以下值得注意的几点:
第一,67以上的选择都是不理性的,因为参加考试的学生数为150-200之间,这是公共知识,即使所有的学生都选择100,胜出的数字都不会超过67。但是还有3位学生选择了大于67的数字,其中选择的最大数为75。他们在给出这些选择时没有给出理由。
第二,分析学生所给出这些选择的理由,可以看出,绝大部分选择者在进行他们的选择时考虑到了他人的选择以及他人的推理。不同的人对他人的假定不同,所进行推理的步骤也不同。如选择67的学生假定了他人都选择100,因而选择67是最优选择;再比如选择30-40之间的数字的同学,其理由大体上有两个:或者认为平均数集中在50-60之间,其2/3就集中在35-40之间;或者认为都选100的话,66.7是最优选择,都选择66.7的话,44是最优选择,而都选44的话,33是最优选择。
第三,有三个区间处的选择比例较高:0-10间为38.6%,21-30间为17.6%,31-40间为25.7%。从所给理由可看出,不同区间的选择者考虑群体的互动推理的步骤存在差别,如0-10区间的选择者考虑他人的推理步骤比31-40区间的选择者多些。
第四,值得注意的是,11-20区间里的选择较少(事实上是,在这个博弈中所选择的数字落在这个区间是最有可能胜出的)。原因可能是,一旦选择者进行了多步的互动推理,他们便能够将这样的推理进行下去,从而将选择向理论解0或1靠近。
第五,有一些“智慧的”选择者,他们知道理论解,但他们知道存在不完全理性的选择,因而他们没有选择理论解。尽管他们的选择没有胜出,他们的推理是有智慧的。这里,本文选择了其中2个。一位选择22的学生是这样给出他所选择的理由的:“作为理性人,我不会选择大于2/3×100的数,因为即使所有人都选择最大数,平均数的2/3也不会超过2/3×100。如果大家和我一样理智,那么大家都不会选择大于2/3×100,那么我不会选择大于100×2/3×2/3。因为他们选择最大的他们可能会选的数,平均数的2/3也不会超过2/3×2/3×100。依此类推,如果全班都充分理智,那么全班最终都会选择1,然而我不认为班里的人都是足够理智,故平均数的2/3会大于1。根据两次游戏,平均数的2/3在20~30。如果是我,我会选择靠近20的数,那我就22吧。”一个选择10的学生的理由是:“如果其他人都是随机选择,那么平均数最后可能接近于50,50×2/3≈33。但是,如果所有人都选择接近33的数,那么33为平均数,33×2/3≈22……如此推理应该为1。但是并非所有人均是理性、均会如此计算。我对南大有信心,所以,我将数字选得接近1一点,选10。”
第六,有一些选择是没有考虑到他人的选择。如有这样一些理由:“大家都认为60是及格分,所以我选择59”,“58是我的幸运数字”,等等。
二、博弈的理论解分析
本实验是一个多人完全信息静态博弈:参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果,每一参与者的收益函数在所有参与者之间是公共知识。
在这个实验中,参加考试的176位学生是参与者,每个考生同时对0-100之间的数字进行选择行动,即每个参与者的策略空间Si∈(0,100),即有101种可能的策略。根据所有考生的选择,每个考生最后得出自己的结果,对每个考生来说,结果无非就是,自己的选择是“大家所选数字的平均数的2/3”,胜出;要么与“大家所选数字的平均数的2/3”不一致,失败。
我们假定该博弈的参与人都是绝对理性人(事实上,这个要求在实际中难以达到,这也是本文要得到的一个结论)。
我们来分析绝对理性人的推理过程。
在这个博弈中策略组合有176×101种,每种策略组合下,每个人的收益是公共知识。如:如所有人都选100,平均数为100,此时每人都失败,胜出结果是100×2/3=67;如175人都选100,有一个人选择了67,那么选100的人失败,而选择67的人胜出……所以这些是理性参与人的公共知识。
我们看到,任何人都不应该选67或以上,或者选择67或以上是非理性的,因为所选择的数字的最大平均数为100,此时胜出的数字为67,因此选择67以上而获胜的可能性是没有。因此,作为理性人他们都不会选择67或以上。
每个人都不会选择67或以上,这本身也是公共知识。在这样的公共知识的前提下,45以上的选择都是不合理的,因为对每个人而言,只有在他人都选择67以上,我选择45或以上才是合理的(67的2/3约为45)。
每个人都不会选择45或以上,这本身也是公共知识。于是,每个人都认为不应该选择30或以上。
……
结论是:每个人选择0或1是合理的,它们是该博弈的理论解。
事实上,每个人选择0或都选择1是纳什均衡:对每个人而言,在其他人不改变选择的情况下,当下的选择是最优的。
在所有人均选择0的情况下,因为对于每个人而言,若所有人都选择0的话,0便成为平均数,该数的2/3还是0。这样,他选择0是最优选择:在他人不改变选择的情况下,他改变选择将失败。因此这点构成纳什均衡。
在所有人均选择1的情况下,同样,对于每个人而言,在其他人选择1的情况下,平均数1的2/3为0.67,此时1最接近该数。因此,他选择1是最优选择,并且若他改变了他的选择他将失败。因此,这点也构成纳什均衡。
当然,面对多个纳什均衡,作为理性的参与人作何选择才能胜出呢?具体到这个博弈中,每个人要考虑的是,他选择0还是选择1才能胜出呢?
他会这样思考:没有理由认为其中一个比另外一个更有可能胜出,这样,选择0或1胜出的概率为50%,但是,他人能够与我有同样的想法。既然如此,期望平均数应该为0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,选择0是最优选择。
从上面的分析可见,尽管0和1是纳什均衡点,但选择。是最优选择。
三、改进博弈论的可能路径
本文已经表明,上述博弈是一个完全信息静态博弈,然而,本实验的实验解(14.61)与理论解(0或1)之间发生偏离。本文认为,有两个主要原因:
第一,博弈论中所假定的理想主体与实际中的决策主体不相符合。理想的博弈参与人是绝对理性人;他们能够进行任何有穷步骤的推理,能够分析所有有穷可能的情况,并且他们的推理、分析是在瞬时完成的,而实际博弈中人们是有界理性的。在我们的博弈实验中若参与者是理想主体,他们能够做本文上一部分那样的分析,他们应当知道0和1是均衡解,也能够预测O是最有可能实现的结果。本实验表明,并不是所有人都能够做出这样分析的。并且,在实际中存在完全非理性的选择,如本实验中选择大于67的3人,这不是完全偶然现象。
一、抓住学生的共性
大学生具有强烈的关注现实问题的意愿,对社会热点问题表现出极高的兴趣,尤其在理解焦点问题时具有很强的可塑性和认知共性。因而应牢牢抓住这一共性,迎合学生在知识需求上的实用化和功利化的特点,从当前丰富的信息资源中寻找承载博弈论知识的现实问题,以期收到事半功倍的教学效果。在教学实践中,笔者把丰田汽车赔偿、西南五省大旱、相亲类节目《非诚勿扰》、2008股市大跌等现实热点都搬上了讲台。下面,笔者就通过教学实例进行说明。
在讲授2005年诺贝尔经济学奖得主托马斯・谢林(Thomas C. Schelling)的博弈承诺及其可信性概念时,笔者以制定《反国家分裂法》为典型案例进行分析。由于祖国统一问题是所有国人关心的国家大事,大学生也不例外,所以讲授过程非常顺利,以致学生在课后反馈中把这一案例列为讲授最成功的部分。接着,为了讲解如何应用可信承诺处理现实问题,笔者选择了电视连续剧《老大的幸福》第四集中的一个视频片段,进一步强化了知识点。实践证明,人物生动的形象在给课堂增添活跃气氛的同时,也很好地承载了传递知识的作用,以缩影的形式把可信承诺的概念和应用可信承诺策略的方法植入了学生的头脑中。最后,笔者以拆迁补偿合同签订中的一种可信承诺策略为例,对本节课进行了总结,并请学生加以点评。由于拆迁问题是当前社会的焦点问题,所以学生对点评表现出极大的兴趣。这样,通过抓住学生的认知共性,展示了可信承诺策略在焦点问题上能够将劣势变为优势的强大作用,成功地引导学生了解并掌握了博弈承诺及其可信性概念。
二、增强主题的典型性和知识模块的简洁性
以经典博弈问题为主题有利于组织素材、选择教学内容,简洁地安排知识模块、弱化知识的层次性有利于照顾各类学生在知识面、综合能力和认知水平上的差异,少而精地选择课程内容有利于突出重点,多角度地反复讲解有利于降低知识门槛,提高学习的效率。
例如:在主题选择上,笔者以多数学生熟知的“囚徒困境”作为第一主题,以试验性强、易于展开的“理性基础和有限理性”作为第二主题,以现实性突出的“重复动态博弈”作为第三主题。由于“囚徒困境”与经济学中的“理性人假设”密不可分,所以第一主题既能让学生感受到博弈问题的趣味性和深刻性,又能激发他们对该主题的进一步思考,使他们逐渐认识到“理性人假设”所具有的超越现实、过于理想的特性,从而部分地为第二和第三主题做好铺垫。另外,有大量关于“囚徒困境”和理性问题的课外资料易于获得,这为学生在课程初期进行兴趣驱动的导读创造了条件。
在知识模块设置上,笔者采取“自成模块、减少关联”的策略。例如:针对非常重要的“信息不对称”主题,我们选择以二手车市场为核心,构建包含药品市场、电脑市场和就业市场等典型主题的知识模块。一方面,这些市场为学生所熟知,易于接受,另一方面,这些市场中包含着非常典型的“信息不对称”因素,因而通过对市场现象的自然描述完全可以弱化学生对经济学市场知识的依赖。为了弱化知识的层次性,突出重点内容,笔者舍弃了理论体系中的某些知识模块,如“海萨尼转换”“斯宾塞信号传递模型”和“斯蒂格利茨信息甄别模型”。
三、重视案例应用,尤其应重视与诺贝尔经济学奖得主有关的案例
博弈论有一个显著特点,那就是它“声名显赫”,并且与诺贝尔经济学奖的关系密切。许多诺贝尔经济学奖得主都曾涉足博弈论领域,在博弈论的建立和发展中直接或间接作出过贡献。“名声在外”为博弈论的诡计公选课的开设提供了有利条件,也为课程的讲授提供了独特的视角和丰富的素材。
纳什是博弈理论发展的划时代人物,纳什均衡是博弈论的核心概念,两者都是公选课中必须包含的内容。为此,笔者设计以下三个环节:(1)借助“囚徒困境”和“情侣博弈”讲授纳什均衡及其不唯一性;(2)播放电影《美丽心灵》,并进行讨论和点评;(3)布置以纳什为主题的案例设计作业,让学生在课堂上演讲。
第一部分是讲解的重点,讲好纳什均衡意味养博弈论课程成功了一半。第二部分可以把人格培养和素质教育有效融合起来,《美丽心灵》不仅能让人体会到学生心灵中因爱而生的温暖,还能给出人生原本就是一场博弈的警示,体现出“大人物小故事”的精髓。纵然纳什这样的天才也有无法摆脱的困境,何况他人?所以,在人生的博弈中,既要承认能力的差异,又要找寻属于自己的色彩。同时还应看到,纵然如纳什般为顽疾所缠都可以逐渐康复,何况其他挫折?所以,要以积极、乐观、健康的心态对待人生,终身学习而不轻言放弃。第三部分是对学生的启发环节。该环节不仅要培养学生对本课程的兴趣,加深学生对知识的理解,还要通过为其提供上台演讲、展示成果的机会,锻炼他们的逻辑思维能力和表达能力。值得一提的是,很多学生在设计案例时自学了有名的“智猪博弈”和“恋爱博弈”等经典模型,巩固了纳什均衡概念,还有学生甚至对纳什曾经设计过的一种“六连棋”博弈游戏进行了分析。
四、重视学科交叉,尤其应重视学科交叉视阈下的学术前沿成果
博弈论己逐渐成为一门为诸多学科提供思维方法和分析技巧的学问,可以说,所有与生命有关的学科都蕴藏着博弈论的应用空间。在公选课中,应重视从学科交叉的视角供给知识,广泛培养各专业学生对课程的兴趣。例如:笔者选择生物演化理论和博弈论交叉所产生的演化博弈论作为知识模块,以人类社会的同性恋演化作为典型主题,挑选最前沿的学术研究案例作为教学的主要内容,为学生进行讲解,扩展了学生的知识面。
在演化博弈论的开创性著作《演化与博弈论》一书中,作者约翰・梅纳德・史密斯(John Mavnard Smith)用精妙的语言、深入浅出的分析和丰富有趣的案例把博弈论的思想融入到生物演化中,推动了对“动物为什么如此”这一问题的深入研究,揭示了动物群体行为演变的动力学机制。笔者首先以“哺乳动物一雄多雌”案例作为引导,简单介绍演化博弈论在性选择和性别比问题上的研究视角以及逻辑结构,然后立刻引出了人类面临的一个有关性的问题――同性恋演化主题下的性问题:从进化论的角度来看,男男同性恋的存在完全没有任何意义,这是因为同性恋相比于异性恋而言成功繁殖后代的可能性太小,那么为什么同性恋的基因没有被淘汰?显然,这一问题接近现实热点,对学生极具诱惑力,而且还具有很强的学术延伸性。为了讲解同性恋基因延续的演化博弈机制,笔者借助2010年2月24日美国心理科学杂志上发表的关于萨摩亚岛上男男同性恋的最新研究成果,利用最前沿的学术案例详细分析了“亲族选择”假说下的演化博弈机制。教学实践表明,通过这样的内容设计,来自不同专业学生的学习兴趣都被调动起来,加深了他们对博弈论的理解,顺利实现了教学的目标。
五、重视开放性,尤其应重视教学信息交流反馈的开放性
信息交流有利于帮助学生巩固所学内容,让有兴趣的学生通过查阅相关资料,获得知识上的感悟和能力上的提升,并逐步脱颖而出。信息反馈有助于教师突出教学的亮点,发现教学中存在的不足,以便在今后的教学中加以改进。
教学实践中,笔者让学生通过电子邮件的形式反馈“课堂心得”,并要求他们同答以下三个问题:(1)这次课对你影响最深或最成功的是哪部分?(2)最失败或可有可无的又是哪部分?(3)对本次课你有什么意见和建议?
这三个问题一方而可以督促学生对课堂内容加以回顾、梳理,另一方而又可以从中发现自己在教学中存在的不足之处。事实上,在交流和反馈中,许多学生都针对课程的内容、进程和教师的教学习惯、技能等提出中肯的批评和建议,帮助教师提高教学水平。这些批评和建议包括讲课的速度有点偏快、思考时间较少、有些理论过于深奥、希望针对时事展开分析、希望多些互动、理论是需要加强的等,当绝大多数学生赞成“少一点数学知识”并希望“讲得详细点”时,笔者采纳了这一建议,并列出了几本偏重数学工具的参考书,让那些“吃不饱”的学生自学。
教学探索与实践的过程是循序渐进的过程,学生在这一过程中所起到的作用是巨大的。只要教师能够及时、充分地了解学生的需求,不断总结、深化课程教学改革的经验,就一定能取得更大的成效。
在缺少合适的教材这一问题上,笔者设想,可以采取灵活性较强的活页方式(如当前许多大学英语教材中都有活页内容)改变这一现状。活页方式既可以突出主题的典型性,又可以涵盖即时事件,满足学生的需要。同时,教材活页的积累还能为课程建设尤其是优质博弈论公选课教材的编著奠定基础。
只要教师能够了解学生的需求,选择恰当的教学方式、方法,不断加以分析、总结,进一步完善教学环节,激发学生的学习兴趣,就一定能顺应高等教育教学改革的趋势,在确保教学质量的基础上,逐渐把博弈论的诡计公选课建设好。
参考文献:
[1]顾建民.高等教育学[M].杭州:浙江人学出版社,2008.
[2]裘松良.转型期高校教育研究与实践[M].北京:高等教育出版社,2010.
[3]胡剑锋.高校经管类教育研究与实践[M].杭州:浙江人学出版社,2011.
[4]潘月明,郭秀芝.人学英语口语公选课教学模式设计与实践[J].高等教育学刊,2009(2).
[5]川浦徐进.本科博弈论教学过程中的案例运用[J].江南人学学报:教育科学版,2009(12).
[6]叶国荣,等.高校本科生教育中研究型教学模式探讨[J].中国高教研究,2009 (3).
所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。
博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。
博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。
博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。
1.完全信息静态博弈:纳什均衡
完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。
2.完全信息动态博弈:子博弈精炼纳什均衡
动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。
3.不完全信息静态博弈:贝叶斯纳什均衡
不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。
4.不完全信息动态博弈:精炼贝叶斯纳什均衡
在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。
国际机制理论的理性主义流派概述
当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International
Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)
新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International
Regimes(London:Cambridge University Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。
新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。
博弈论与国际机制理论
在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International
Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)
早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。
关键词:群体决策;信息集结;博弈论;信息获取;审议;透明性
一、引言
群体决策的研究涉及多个学科,不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结,较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理,研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择,这方面的研究源于Condorcet投票悖论的提出,从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展,已形成完整的理论体系,通过对理性社会选择本质的剖析,促进了人们对选举、立法以及政治机构运作等问题的理解。
在管理科学领域,对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结,使得群体成员就最终决策达成某种程度上的一致,而一致性则意味着“正确性”,这方面最具代表性的是社会决策图式理论。
在社会心理学领域对群体决策的研究主要采用实验性方法,通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性,一般假定群体成员具有共同的目标,很少考虑决策过程中的策略,心理学研究的主要成果是对群体思维和群体极化现象的分析。
近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献,这些文献主要发表于经济学、政治学与政治经济学期刊,通过对群体决策过程中群体成员的动机和理的分析,给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披 露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是,这四个方面紧密关联,特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响,而群体成员的信息获取动机则部分地取决于信息披露动机,但由于利用博弈论分析群体决策问题的复杂性,现有的文献主要还是相对集中于其中的一两个方面。
文[1]是注意到此领域较早的综述性文章,该文发表于1999年,讨论了当时出现不久的研究政治机构信息集结作用的文献,其中对最先考虑策略性投票表决行为的文[2-5]等进行了简要介绍。同年9月份,《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果[6],其中提及的部分研究工作尚处于未发表状态。文[7]对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文[8]总结了货币政策委员会决策机制设计应该考虑的各种因素,对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述,其中讨论了信息集结问题。应该说文[9]是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章,该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述,并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。
本研究与文[9]的差别在于:第一,文[9]的讨论基本上局限于基于博弈论的群体决策信息集结研究本身,而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比,分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点,并深入探讨了现有研究工作存在的不足之处,也即指出了此领域可能的研究方向,因此,笔者的深度与广度有所超越。第二,文[9]对此领域研究成果的评述思路稍显混乱,文献分类较不合理。第三,笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献,而文[9]对此几乎没有涉及。第四,文[9]发表后此领域出现了不少具有重要参考价值的文献,笔者对这些最新的文献给予了较为详细的评述。
二、决策信息的获取
(一) Condorcet陪审团定理与搭便车问题
与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统,群体决策的意义之一,是可能更充分地利用这些信息,因而更有可能作出正确的决策。不考虑其他因素,仅从信息集结的角度看,让更多拥有信息的个体参与决策可以改善决策质量,这种观点符合人们的直觉,其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为:群体决策可以有效集结信息,在多数决定规则下,增加群体成员数量可以增加作出正确决策的概率,并且随着成员数量趋于无穷,作出正确决策的概率趋于1。
Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设:群体决策者所掌握的与决策问题相关的信息是事前外部给定的,或是以零成本获得的[9]。但对于许多现实决策情形,信息并不是不需要投入成本和努力就能轻易得到的,如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准,因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中,与决策问题相关的信息是公共物品,因而存在典型的所谓社会惰化(social loafing)现象或搭便车问题(freerider problem)。
文[10]对陪审团决策中的信息获取问题进行了研究,认为陪审员的信息准确程度取决于陪审团的大小,更大的陪审团的陪审员具有更少的动机认真听取审判过程,所以更大的陪审团作出正确判决的概率可能更小,从而导致陪审团定理不再成立。文[11-17]进一步研究了群体决策中的理性无知(rational ignorance)问题,对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析,这些文献针对多数决定规则,假定所有群体成员具有完全相同的决策偏好。其中文[11,13-15]证明,当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零,则Condorcet陪审团定理仍然有效。
另外,文[18]通过一个仅有两个成员的群体决策模型,指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中,决策成员首先收集关于一项工程实施后果的信息,然后相互交流,再投票表决是否实施该项工程。文章指出,如果交流的作用仅限于信息集结,则交流可能会减少作出正确决策的概率,特别是当高质量的信息很容易获得时,交流会减少决策成员收集信息的动机,加剧信息收集中的搭便车问题,但当信息收集需要付出高昂的代价时,更多的交流通常会增加作出正确决策的概率。
(二)搭便车问题避免措施
因为信息获取活动一般是不可观测的,搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入,所以无法通过有效的惩罚措施以阻止搭便车问题,只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。
文[19-20]的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考,指出具有极端偏好的成员相对来说更具有收集高成本信息的动机,但这两篇文献的研究内容不属于严格意义上的群体决策,因为其中的委员会成员仅负责收集与报告信息,自身并没有决策权。在文[19]中,委员会成员在信息收集之前相互间没有偏好差异,在投入不可观测的努力收集信息后形成各自不同的政策偏好,该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大,因为预期的偏好差异为成员提供了收集信息的动机。文[20]指出,如果信息收集的成本较低,委员会成员的偏好应该与决策者的偏好类似,这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息,另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题;如果信息收集的成本较高,则委员会应该由具有极端偏好的成员组成,只有这些成员才具有足够强烈的动机付出代价收集信息,但因为信任问题,他们往往只会收集硬信息,即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说,文[20]的研究结论尤其具有参考价值。
从群体决策机制设计的角度看,如果存在信息获取问题,则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息,又要考虑如何有效集结成员所获得的信息,以最大化群体决策的期望效用。
文[21]证明,采用适当保守的决策规则可以促进群体成员收集证据,从而改善决策质量。文[22-23]对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文[22]指出,尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力,但一致性规则并不能为获取信息提供适当的激励,而且一致性规则特别不适合于信息较不准确的情形,也即更需要群体决策的情形,在只考虑单调纯策略均衡的条件下,除非群体成员的信息足够准确,否则一致性规则或接近于一致性规则的规则不可能最优。文[23]认为,为了提供足够的信息获取激励,对于相当普遍的决策情形,事前最优的决策机制事后可能是非最优的,即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结,该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是,文[21-23]均假定决策群体成员具有相同的偏好。
三、审议过程中信息的披露
决策群体,尤其是规模较小的群体,一般会在投票表决前对决策选项进行审议,交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体,具有不同的利益追求或偏好,因而具有操纵或隐藏私有信息的动机,从而限制了信息共享的可能性,成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。
绝大多数群体决策文献对审议(deliberation)、交流(communication)、辩论(debate)、廉价磋商(cheap talk)等类似表述用语没有进行明确的区分,虽然这些用语在不同场合有一些微妙甚至较大的差异,如文[24]认为审议是辩论的子集。
研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈:先审议后正式投票表决,通过对贝叶斯Nash均衡策略和均衡存在条件的分析,研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准,好的决策选择总是部分取决于世界的真实状态,而世界的真实状态对决策群体成员来说无法确切知道,他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息,然后,根据各自已掌握的关于世界真实状态的部分信息,群体成员形成自己对世界真实状态的判断,进而根据自己的评判标准形成各自的决策选择偏好,如果他们的决策选择偏好不一致,就有可能在审议的过程中不披露自己的真实信息,或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此,此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。
Coughlan在文[25]中认为,当所有群体成员的决策偏好完全相同或足够接近,在审议过程中每个成员都具有真实披露私有信息的动机。文[26]则进一步证明,只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性,客观上的偏好差异不会影响信息的真实共享。然而,该文同时指出,审议并不总是能有效集结信息,特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时,可能出现有意的相互欺骗。需要说明的是,在文[26]给出的模型中,所有群体成员的偏好或者完全相同,或者完全相反,与此相符的现实群体决策情形很少,甚至几乎没有。文[24,27-28]证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机,多数决定规则比一致性规则能引导出更多的信息共享。文[28]还证明,在相当一般的条件下,审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合,也即审议使得所有的无否决权规则在序贯均衡方面等价,从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会,那么采用除一致性规则以外的其他任何决策规则,都会产生相同的决策结果。文[29]对陪审团在审议阶段信息的披露进行了实验研究,以无约束力的意向性投票形式实现信息的交流,实验结果与理论分析基本近似。
另外,文[30]给出了一个两成员的交流与决策模型,两个成员投票表决是否组成具有不确定回报的合伙关系,他们的偏好不一致且为私有信息。文章分析了均衡的特征,发现在均衡时仅有部分信息被传递,交流对于双方的福利是有益的。
对于很多现实决策问题,决策者可能拥有客观上可验证的信息,即所谓硬信息(hard information)。文[31]对硬信息在具有偏好冲突的委员会中的交流进行了研究,证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在,即允许更大程度上的偏好差异;另外该文证明,如果信息可验证,完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文[32]指出,在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性,如果决策成员能够为自己的信息提供验证材料,则一致性规则比其他规则提供了更强的信息共享激励,更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。
文[33]指出,尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机,但给予群体成员适当的外部激励能消除此类动机,促进信息与偏好的完全集结,而且随着群体规模的扩大,外部激励的强度可以很小,外部激励的具体措施包括对成员决策能力的肯定等。
四、透明性的影响
随着社会的进步,公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献,从而引起决策者对自身声誉的关注,而对声誉的关注既可能促进信息的获取和真实信息的披露,但也有可能导致信息传递与投票表决行为的扭曲。
在文[34]中,委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任,而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文[35]认为,仅公布最终决策结果,不公开个人投票记录,会诱导委员会成员按照现有偏见作出投票选择,因此,委员会的决策倾向于保守化,向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为,群体决策机制的设计应该不仅考虑决策过程的透明性,也要考虑决策规则的适当性,如果决策规则选择合适,则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文[34-35]所给出的模型中,都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。
在文[36]中,委员会代表公众对一项新工程的实施与否进行表决,委员会成员既关心工程的实际价值,又关心委员会在公众中的声誉,如果维持现状,不实施新工程,则暴露出委员会成员意见的不一致,从而给委员会的声誉带来负面影响,而公众仅能注意到委员会的决策结果,事后不能观测到工程的实际价值。该文证明,在审议阶段,部分成员对声誉的过分关注可能使他们不愿真实披露私有信息,而是夸大工程的价值,导致更容易采取实施新工程的决策。文[37]认为,公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断,使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧,公众对于决策过程透明性的要求,可能导致委员会在正式会议之前组织秘密的非正式预备会议,将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段,从而对公众消除委员会内部意见的不一致,而非正式的会议更具有不稳定性,因此,透明性要求并不一定能增加社会福利。
在文[38-40]中,外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果,但对于秘密委员会则只能看到最终决策结果,而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文[38]和[39]认为,不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响,在某些情况下秘密委员会优于公开委员会。文[39]还特别指出,由于随着群体成员数量的增加,单个成员的投票对最终决策具有决定性影响的概率减小,对单个成员而言不诚实投票的代价随之减小,所以对于公开委员会来说,其成员更容易因外部利益关联者承诺给予的回报而不诚实投票,因此Condorcet陪审团定理可能不再成立。在文[40]中,对于秘密委员会,外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则,指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果,传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确,但对于公开委员会则不存在此问题。文[41]虽然不是直接研究透明性,但其研究结论与此处内容相关,该文通过一个博弈模型,说明在特定情况下,外部利益集团可以不用付出任何代价就能操纵委员会的决策。
另外,不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文[7,42]对这方面的文献进行了综述。文[42]区分了三种类型的透明性:决策目标透明性;知识透明性,这里的知识指决策所依据的经济数据或经济模型等;操作透明性,包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文[7]专门讨论了货币政策委员会决策过程中的动机问题,指出货币政策委员会的最优规模与透明性等仍有待进一步研究。
类似于文[34],研究透明性对货币政策委员会决策信息集结有效性的影响的文献,一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价,从而获得连任的机会,如文[43]假设委员会成员希望公众认为他是通货膨胀的强硬抵制者,而最近的文献如文[44-46]等,则假设委员会成员希望公众认为他是具有较强决策能力者。文[44]认为,公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见,该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文[45-46]分析了投票记录的公开对委员会成员投票表决行为的影响,认为投票记录对公众的透明带来的负面效应占主导地位,透明性不能增加社会福利。
五、最优决策规则
显而易见,不同的决策规则极大地影响了群体决策的信息集结效率,尤其是决策群体成员的偏好或能力不完全一致时,决策规则更是直接影响了群体成员的投票选择行为,进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择,除此以外,另有部分文献对各种情况下的最优决策规则进行了研究。
文[47-48]从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析,文[49-50]研究了在特定约束条件下的最优决策规则。然而,这些早期的文献都有个潜在的假设:决策成员仅按照自身获得的信息作出投票选择。文[2,51]等指出,即使决策群体成员的偏好完全一致,也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息,因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求,当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时,所有群体成员仅按自身信息投票才是Nash均衡,而最优决策规则则取决于特定的决策情形。
文[52]证明,当采用文[48]所定义的最优决策规则时,所有成员仅按照自身获得的信息投票表决形成Nash均衡,但仅按自身信息投票可能不是有效的,因为部分成员联合决定策略性投票可以增加期望效用。文[53]讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题,试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机,文[54]提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法,在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择,可以激励投票者诚实投票,从而得到Condorcet陪审团定理的有效性收敛结果。
文[55]基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型,证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文[56]分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形:给定决策群体的投票表决规则,提案者向决策群体提出一个要么完全接受要么完全拒绝的议案,群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案,所以增加了决策群体的期望效用,在某些情况下,一致同意规则甚至是Pareto最优的表决规则,因为它也增加了提案者的期望效用,即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献[22,24,27,28,32,55,56],可见博弈分析得到的结论往往与人们直观上的认识截然相反,一致性规则是不是合适的决策规则完全取决于特定的决策情形。
既然投票表决规则直接影响了投票者的投票选择行为,那么,对于群体决策机制的设计者来说,他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为,换言之,机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文[57-58]对此问题进行了研究,其中假设群体成员的决策偏好完全一致。文[57]分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则,指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文[57]的结论,文[58]认为,决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关,在该文中,机制设计者为决策群体选择投票表决规则,其目的是为了最大化决策群体的期望福利,文章证明,仅从信息集结的角度看,关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说,结论是一样的,不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说,文[57-58]的研究结论大大简化了决策规则的选择。
现实中的决策群体往往存在具有极端偏好的成员,这些成员的存在为信息的有效集结带来较大的困难。文[59]对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究,考虑了决策成员之间存在转移支付的情况,指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文[60]对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析,对比了一致性规则与非一致性规则的信息集结效率。文[61]给出了一个现实中较难接受的非单调性决策规则――超多数惩罚(supermajority penalty)规则,当选择某一选项的投票过多时,将该选项作为群体决策最终结果的概率反而会下降,该文证明,当对于每个选项都存在极端偏好者时,超多数惩罚规则是最优匿名激励相容规则。
前述文献都假定群体成员的偏好相互独立,而文[62]对群体成员具有相互关联但不完全相同的偏好的情况进行了分析,其中的决策选择空间是连续的,该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题,并比较了这两种规则在不同偏好关联程度下的性能。
由于从众心理,群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文[63-64]对从众心理对群体决策的影响进行了研究,其中假定群体成员一方面希望选出好的决策选项,另一方面又希望自己成为胜出的一方。文[63]分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量,文[64]指出这种从众心理导致同时存在多个均衡,而且对于这些均衡中的多数,信息不能被有效集结。文[64]从某种程度上说明了最优决策规则设计的困难。
六、现有研究工作的不足之处
其一,社会选择理论与公共选择理论以及管理学领域对群体决策的研究,主要考虑偏好集结的有效性,而其中的偏好则是指对决策选项的偏好,这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中,纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在,例如社会选择理论与公共选择理论最重要的应用领域――选举,既是偏好集结(这里指更根本意义上的偏好),更是信息集结。仅考虑偏好的集结问题,不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用,无法分析群体内外部交流与互动等对决策的影响,无法解释现实中的很多现象,因而对相关决策机制设计的指导作用较为有限。
其二,社会心理学从认知的角度研究群体决策,其结论出自于对实验和经验数据的统计学分析,易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难,所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。
其三,与社会选择理论和公共选择理论一样,用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的,但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识,通过对群体决策者动机的分析,有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略,进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加,审议方式和决策规则趋向于书面化和正规化,群体思维与群体极化现象将很少出现,决策结果也将更接近于博弈分析的预测。
目前对群体决策信息集结问题的研究尚处于起步阶段,还有很多不完善之处,在某些方面甚至存在根本性的缺陷。
第一,可能是受到信息经济学研究的误导,本领域的很多理论与实验分析文献,包括一些奠基性的文献,混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价,更不会如判断的披露那样引起认知上的从众,如果决策者掌握了确凿可靠的信息,则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。
除个别文献外,现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商,将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中,审议至少包括对各方面提供的信息的真实性的审议,以及对信息与世界真实状态之间的逻辑关联(即潜在的决策模型)的审议。因此,将审议建模为完全的廉价磋商的现实意义极为有限,对于偏好差异较大的群体更是如此。
第二,客观上难以验证的信息的可接受性,取决于接收者对于信息发送者的偏好的信念,例如,人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面,在很多情况下,信息的软硬程度(可验证程度)与信息获取者和信息接收者的成本投入相关。因此,群体成员获取可验证信息与不可验证信息的动机,以及群体成员对信息软硬程度的投入,既取决于是否有审议阶段以及审议方式和决策规则,也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。
群体决策在现代社会无处不在,如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发,针对特定的决策问题,为了尽可能作出正确的决策,应该如何组成决策群体,选择何种决策规则?此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心,其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。
中国学者对群体决策的理论与方法进行了大量的研究,提出了不少新的概念和方法,作出了很多重要贡献,国家自然科学基金委员会对群体决策理论与方法研究也较为重视,曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要,总体感觉国内对决策群体成员的动机和理考虑较少,到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。
笔者试图利用不完全信息博弈论和机制设计理论,研究决策群体成员的策略性信息获取、信息传递和投票表决行为,揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度,为一些典型公共决策情形优化决策机制。
参考文献:
[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.
[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.
[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.
[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.
[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.
[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.
[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.
[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.
[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.
[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.
[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.
[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.
[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.
[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.
[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.
[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.
[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.
[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.
[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.
[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.
[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.
[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.
[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.
[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.
[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.
[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.
[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.
[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.
[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.
[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.
[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.
[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.
[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.
[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.
[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.
[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.
[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.
[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.
[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.
[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.
[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.
[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.
[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.
[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.
[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.
[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.
[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.
[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.
[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.
[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.
[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.
[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.
[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.
[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.
[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.
[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.
[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.
[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.
[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.
[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.
[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.
[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.
关键词:认知无线电;功率控制;非合作博弈;纳什均衡;效用函数
中图分类号:TN014文献标识码:A文章编号:1672-3198(2009)16-0265-02
0 前言
认知无线电(cognitive radio,CR)是以软件无线电(software radio)技术为基础的能够提高无线通信频谱利用率的新技术。在很多国家,传输效率较高的频段是以授权分配的方式分配给无线通信业务部门和运营企业的,但这些频段的授权用户并不是在任何时刻都使用分配给他的频段,因此不少传输效率很高的授权频段会经常处于空闲状态,这就浪费了宝贵的频谱资源。根据美国联邦通信委员会(FCC)所进行的大量研究表明,在大部分地区,授权频段的平均利用率在15%―85%之间,而一些传输效率较高的非授权频段则过于拥挤。于是Joseph Mitola博士在1999年首先提出了认知无线电概念,目的就是解决频谱资源的有效利用问题。
博弈论(Game Theory)又被称为对策论,是现代数学的一个分支,也是运筹学的一个重要组成部分,是研究互动决策的理论。John Nash博士在1950年提出了纳什均衡(Nash equilibrium,NE)即非合作博弈均衡的概念。该理论指出,在一策略组合中,所有的参与者都面临这样一种情况,当其他人不改变策略时,他此时的策略是最好的,此时便达到了纳什均衡。在纳什均衡点上,每一个理性的参与者都不会有单独改变策略的冲动。这种参与者为了各自利益的最大化不断改变策略的做法,与CR中各认知用户为争得传输效率的最大化对频谱和功率不断进行调整的自适应算法策略相符。因此,可以引入非合作博弈论模型对CR的频谱分配和功率控制算法进行检测和优化。
本文以认知用户的满意度为设计目标,引入代价函数得到一种新的基于非合作认知无线电功率控制的博弈模型,并结合对该模型的分析介绍了非合作博弈论在CR中的一般分析方法。
1 认知无线电体系结构
认知无线电是对软件无线的扩展,因此具备软件无线可重新配置的特点,并且能够实现基于环境认知的自动配置。S•Haykin根据CR所必需的频谱扫描、信号分析、参数测量、频谱决策、协议分析等功能,给出了CR系统构成的基本功能结构,该结构将CR系统分为三个功能模块。
(1)无线频谱分析模块。
该模块通过接收环境中的射频激励,并利用自身算法对激励信号进行动态分析,实时提供对环境中频谱空穴的检测情况,搜集可使用的频谱空穴的信息。
(2)无线信道估计模块。
该模块根据无线频谱分析模块的分析结果,对无线信道状态和容量进行估计,为系统通信信道的选择提供依据。
(3)传输功率控制和动态频谱管理模块。
该模块根据频谱分析模块和信道估计模块的分析结果,选择最优的频谱空穴进行通信。在通信过程中对传输功率进行实时控制,使得首要用户和次要用户均能达到最优的通信水平。
S•Haykin给出的三个功能模块共同构成了CR系统的物理层,从各个模块所具备的功能可以看出认知无线电是应用了多种现代信号处理技术的综合性通信平台。
2 非合作博弈论在认知无线电中的分析方法
认知无线电中的策略选择问题及相关算法的设计是该技术的研究核心。利用非合作博弈论,可以按以下方法及步骤对自适应算法进行分析:
(1)该算法是否能达到纳什均衡。即验证算法是否能达到纳什均衡,具体步骤为:先将所研究的问题抽象为相应的非合作博弈算法模型,然后证明该模型中NE的存在性和唯一性。
(2)该算法达到纳什均衡(NE)后的稳定状态是否符合帕累托最优(Pareto Optimality)。即根据系统的目标函数衡量这一稳定状态是否是实际应用环境中的最优情况。
(3)该算法达到纳什均衡和帕累托最优的约束条件。
3 基于非合作博弈论的认知无线电功率控制模型
在认知无线电中,非授权用户接入处于空闲状态的授权用户频段,可以提高系统的频谱利用率,但是该接入过程必然会导致授权用户和非授权用户之间的干扰。这是由于在CR系统中通常采用动态功率控制以扩大通信系统的工作范围,而每个用户的发射功率都会对其他用户造成干扰。2003年,为了规范移动频段的非授权操作,美国联邦通信委员会(FCC)提出了新的量化和管理干扰的指标――干扰温度。在给定干扰温度和频谱空穴的限制下控制发射功率,可以看做为一组策略问题,而且在实际环境中很好的符合了非合作博弈的模型。在CR中,每个用户都从自身的利益出发,追求功率的最大化,而任何用户发射功率的增大都会对其他用户利益造成影响。因此需要提供一种有效的算法对各个用户的发射功率进行动态控制,以达到所有用户的总利益最大化。
在CR中可以用信道利用率、系统吞吐量、系统信干比等指标来衡量用户的利益。假设以系统信干比来衡量,设计算法时就应当以系统的总干扰水平最小化为设计目标。
通常把授权用户称为主要用户(Primary User),非授权用户称为次要用户(Secondary User)。假设通信环境中多个主要用户和次要用户同时工作,次要用户具有认知能力,即把次要用户看做认知用户。假设认知用户i的发射功率为pi,传输增益为gi,且认知用户与基站存在通信链路,基站接收到的该用户的功率为pigi,第j个主要用户对第i个次要用户的干扰为Qij并有M个主要用户,则相应的次要用户在基站处的信干比(SNIR)为:
ri=WRi•pigi∑Nj=1,j≠ipigi+σ2+∑Mj=0Qij(1)
其中σ2为基站处背景噪声,Ri为传输速率,W为第i个用户在的扩频带宽。
文献提出的非合作的认知无线电网络的功率控制纯策略的博弈模型(NPCG)定义了:参与者I={1,2,…,N}为认知网络中非授权用户的集合;策略空间pi,认知用户在一次博弈中选择的策略构成功率矢量P={p1,p2,…,pN};用 表示用户i的效用,即用户i对所选策略的满意程度,其中p-i是除i外其他N-1个用户的功率。
在该模型中,每个认知用户的策略都是尽量增大功率,以获得更高的效用。但当功率超过干扰温度后,整个系统的性能会迅速恶化,进而造成每个用户的效用都会降低。因此,必须选定合适的代价函数,使用户获得更高效用时付出相应的代价。考虑到在低于干扰温度时,用户只需付出较小的代价,而当超过干扰温度时,每增加一定的效用必须让用户付出更高昂的代价,笔者选择SINR的正切函数做为代价函数:
Ci=tg(kri)(2)
其中k为干扰系数,在认知用户发射功率接近干扰温度时,kri的取值接近π2 。
在非合作的认知无线电网络的功率控制纯策略的博弈模型的基础上,结合式(2)笔者提出基于非合作的功率控制算法的数学模型:
ui(pi,p-i)=Ripif(ri)-λpiritgri(3)
其中piri表示增加单位信干比所要增加的功率,λ为惩罚因子,代表代价函数有效性的量度。该模型通过引入代价函数增加了惩罚机制,以此来控制认知用户为追求信干比一味增大发射功率的行为。当功率超过干扰温度后的严厉惩罚,会使所有认知用户意识到,牺牲一定的信干比可以带来效用的最优,从而将发射功率控制在干扰温度以下,避免了超过干扰温度后系统性能迅速下降的恶性情况出现。
按照上节介绍的分析步骤对式(3)给出的模型进行分析,讨论该模型是否存在纳什均衡(NE)以及是否符合帕累托最优。对式(3)求一阶导数后可求得微分方程的驻点,进而再求出二阶导数,易证式(3)的二阶导数小于零。因此可得出该非合作博弈过程中NE的存在性和唯一性,所求得的驻点为唯一的纳什均衡点,同时该驻点即为所应满足的约束条件。
4 结论
认知无线电概念提出的20年以来,随着相关技术的研究不断深入、相关传输标准的确立以及计算机处理能力的提高,CR的应用越来越广泛。本文首先介绍了CR物理层的基本结构,然后结合一种新的基于NPCG的非合作非合作功率控制模型的构建,介绍了非合作博弈论在认知无线电中的分析方法。综上所述,我们有理由相信,随着相关理论和技术的不断进步,非合作博弈论必将在认知无线电的功率分配、频谱分配以及其他核心研究方向发挥更大的作用。
参考文献
[1]S.Haykin,Cognitive radio:Brain - Empowered Wireless Communications Selected Areas in Communications, IEEE Journal, 2005,23(2):201-220.
[2]FOSCHINI G J, MILJANIC Z, A Simple Distributed Autonomous Power Control Algorithm and Its Convergence[J]. IEEE Transactions on Vehicular Technology, 1993,(42):641-646.