欢迎来到优发表网

购物车(0)

期刊大全 杂志订阅 SCI期刊 期刊投稿 出版社 公文范文 精品范文

博弈论的方法范文

时间:2023-10-16 15:59:51

序论:在您撰写博弈论的方法时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。

博弈论的方法

第1篇

[关键词]博弈论;理性人假定;公共知识;社会科学方法

[中图分类号]C3

[文献标识码]A

[文章编号]1671-511X(2012)04-0020-03

博弈论是研究理性人的互动的理论,或者说研究交互决策的理论。1928年,冯·诺依曼证明了博弈论的基本原理,宣告了博弈论的正式诞生。1944年,冯·诺依曼和摩根斯坦合著的《博弈论与经济行为》将二人博弈推广到n人博弈结构并将博弈论系统应用于经济领域,奠定了这一学科的基础和理论体系。1950-1951年,约翰·纳什利用不动点定理证明了均衡点的存在,为博弈论的一般化奠定了坚定的基础。塞尔顿、哈桑尼、谢林、奥曼等人的研究也大大推动了博弈论的发展。因此,尽管博弈论是一门新生的学科,但是它今天已经发展成为有较完善的理论体系的科学。

今天,博弈论已经成为社会科学的通用方法论。尽管它是演绎科学,对社会现象有强大的解释力,然而,由于其理想主体的假定使得其演绎出的理论解与实际博弈结果存在差异。许多实验经济学家通过博弈实验研究实际中人们的博弈过程,分析博弈论的演绎解与博弈实验结果之间的差异。如2002年诺贝尔经济学奖就颁发给了丹尼尔·卡尼曼和迈农·史密斯,他们是实验经济学的先驱。今天在西方学术界通过实验来验证博弈的理论结果已经成为一种潮流。本文下面设计并进行了一个博弈实验,通过分析实验结果与理论解的差异,分析博弈论作为社会科学方法论的局限性,并提出改进的可能路径。

一、博弈实验及结果分析

1 实验描述

我们设计了如下的一个博弈实验。该实验的参与人是南京大学选修文化素质课“逻辑与科学方法基础”的大学生,他们是二三年级的学生,文理科学生均有。

该实验是以试题的形式进行的,该试题作为期末试卷中的最后一道题。该题目为:

在0-100之间选择一个数字,规则是:若你选择的数字“是或最接近”在座同学所选择的数字的平均数的2/3(即在座同学所选数的总和除以总人数之后所得数字的2/3,如:若平均数为90,你应当选2/3×90=60),你将获胜。请给出你选择的理由。

实验说明:

(1)实验参与者即参加考试的学生,事前不知道这是一个实验;

(2)该课程教师以讲座的形式给实验参与者传授过博弈论知识,但没有提到所进行的博弈;

(3)因为(2),他们中的大多数掌握“博弈”、“公共知识”等概念;

(4)试卷是保密的,没有任何学生预先知道考试内容,考试过程中学生间无任何交流;

(5)该博弈的理论解(即纳什均衡)为0或1。

2 实验结果

对于考试中的每个学生,在这个博弈实验中他能够获胜的关键是,他要准确猜测他人是如何选择的,一旦他猜测正确,他将他猜测的平均数乘以2/3便是获胜答案。

共有176人参加了考试。排除掉5个不明确的选择,供分析的实际选择数为171个(其中3个选择非整数)。实验结果为(按照数字大小排序):

“0”:46人;“1”:14人;“5”:1人;“9”:1人;“10”:4人;“12”:1人;“15”:3人;“20”:3人;“22”:18人;“22.44”:1人;“24”:1人;“25”:3人;“28”:2人;“29”:1人;“30”:4人;“32”:2人;“33”:24人;“100/3”:1人;“34”:4人;“35”:1人;“36”:2人;“38”:3人;“39”:1人;“40”:6人;“43”:1人;“44”:5人,“45”:3人;“47”:1人;“50”:3人;“58”:1人;“59”:1人;“60”:2人;“66”:1人;“67”:3人;“”:1人;“72”:1人;“75”:1人。

3 结果分析

在这些所选择的数字中,最大的数字为75,最小的数字为0。171个数字相加后的平均数为21.91,本博弈胜出解:21.84×2/3=14.61。

这个博弈中,0和1是均衡解(下一部分将分析),它们是“理论解”。在该实验中,0是所选最多的数字,共有46人选择,比例为26.9%;选1的为14人,比例为8.2%。两者相加共有60人,比例为35.1%。

从上述数据可以看出,在这场博弈中,“实验解”为14.61,最接近该数的是14或15,这和“理论解”的“0”或“1”不同。在本实验中,没有人选择14,而选择15的有3人,这3人是该实验的胜出者。

若按照区间来统计,实验结果的分布情况见表1。本博弈实验的“实验解”14.61落在11-20之间。若我们把11-20看成是胜出区间,则有7人胜出。

对于这些选择,有以下值得注意的几点:

第一,67以上的选择都是不理性的,因为参加考试的学生数为150-200之间,这是公共知识,即使所有的学生都选择100,胜出的数字都不会超过67。但是还有3位学生选择了大于67的数字,其中选择的最大数为75。他们在给出这些选择时没有给出理由。

第二,分析学生所给出这些选择的理由,可以看出,绝大部分选择者在进行他们的选择时考虑到了他人的选择以及他人的推理。不同的人对他人的假定不同,所进行推理的步骤也不同。如选择67的学生假定了他人都选择100,因而选择67是最优选择;再比如选择30-40之间的数字的同学,其理由大体上有两个:或者认为平均数集中在50-60之间,其2/3就集中在35-40之间;或者认为都选100的话,66.7是最优选择,都选择66.7的话,44是最优选择,而都选44的话,33是最优选择。

第三,有三个区间处的选择比例较高:0-10间为38.6%,21-30间为17.6%,31-40间为25.7%。从所给理由可看出,不同区间的选择者考虑群体的互动推理的步骤存在差别,如0-10区间的选择者考虑他人的推理步骤比31-40区间的选择者多些。

第四,值得注意的是,11-20区间里的选择较少(事实上是,在这个博弈中所选择的数字落在这个区间是最有可能胜出的)。原因可能是,一旦选择者进行了多步的互动推理,他们便能够将这样的推理进行下去,从而将选择向理论解0或1靠近。

第五,有一些“智慧的”选择者,他们知道理论解,但他们知道存在不完全理性的选择,因而他们没有选择理论解。尽管他们的选择没有胜出,他们的推理是有智慧的。这里,本文选择了其中2个。一位选择22的学生是这样给出他所选择的理由的:“作为理性人,我不会选择大于2/3×100的数,因为即使所有人都选择最大数,平均数的2/3也不会超过2/3×100。如果大家和我一样理智,那么大家都不会选择大于2/3×100,那么我不会选择大于100×2/3×2/3。因为他们选择最大的他们可能会选的数,平均数的2/3也不会超过2/3×2/3×100。依此类推,如果全班都充分理智,那么全班最终都会选择1,然而我不认为班里的人都是足够理智,故平均数的2/3会大于1。根据两次游戏,平均数的2/3在20~30。如果是我,我会选择靠近20的数,那我就22吧。”一个选择10的学生的理由是:“如果其他人都是随机选择,那么平均数最后可能接近于50,50×2/3≈33。但是,如果所有人都选择接近33的数,那么33为平均数,33×2/3≈22……如此推理应该为1。但是并非所有人均是理性、均会如此计算。我对南大有信心,所以,我将数字选得接近1一点,选10。”

第六,有一些选择是没有考虑到他人的选择。如有这样一些理由:“大家都认为60是及格分,所以我选择59”,“58是我的幸运数字”,等等。

二、博弈的理论解分析

本实验是一个多人完全信息静态博弈:参与者同时选择行动,然后根据所有参与者的选择,每个参与者得到各自的结果,每一参与者的收益函数在所有参与者之间是公共知识。

在这个实验中,参加考试的176位学生是参与者,每个考生同时对0-100之间的数字进行选择行动,即每个参与者的策略空间Si∈(0,100),即有101种可能的策略。根据所有考生的选择,每个考生最后得出自己的结果,对每个考生来说,结果无非就是,自己的选择是“大家所选数字的平均数的2/3”,胜出;要么与“大家所选数字的平均数的2/3”不一致,失败。

我们假定该博弈的参与人都是绝对理性人(事实上,这个要求在实际中难以达到,这也是本文要得到的一个结论)。

我们来分析绝对理性人的推理过程。

在这个博弈中策略组合有176×101种,每种策略组合下,每个人的收益是公共知识。如:如所有人都选100,平均数为100,此时每人都失败,胜出结果是100×2/3=67;如175人都选100,有一个人选择了67,那么选100的人失败,而选择67的人胜出……所以这些是理性参与人的公共知识。

我们看到,任何人都不应该选67或以上,或者选择67或以上是非理性的,因为所选择的数字的最大平均数为100,此时胜出的数字为67,因此选择67以上而获胜的可能性是没有。因此,作为理性人他们都不会选择67或以上。

每个人都不会选择67或以上,这本身也是公共知识。在这样的公共知识的前提下,45以上的选择都是不合理的,因为对每个人而言,只有在他人都选择67以上,我选择45或以上才是合理的(67的2/3约为45)。

每个人都不会选择45或以上,这本身也是公共知识。于是,每个人都认为不应该选择30或以上。

……

结论是:每个人选择0或1是合理的,它们是该博弈的理论解。

事实上,每个人选择0或都选择1是纳什均衡:对每个人而言,在其他人不改变选择的情况下,当下的选择是最优的。

在所有人均选择0的情况下,因为对于每个人而言,若所有人都选择0的话,0便成为平均数,该数的2/3还是0。这样,他选择0是最优选择:在他人不改变选择的情况下,他改变选择将失败。因此这点构成纳什均衡。

在所有人均选择1的情况下,同样,对于每个人而言,在其他人选择1的情况下,平均数1的2/3为0.67,此时1最接近该数。因此,他选择1是最优选择,并且若他改变了他的选择他将失败。因此,这点也构成纳什均衡。

当然,面对多个纳什均衡,作为理性的参与人作何选择才能胜出呢?具体到这个博弈中,每个人要考虑的是,他选择0还是选择1才能胜出呢?

他会这样思考:没有理由认为其中一个比另外一个更有可能胜出,这样,选择0或1胜出的概率为50%,但是,他人能够与我有同样的想法。既然如此,期望平均数应该为0.5×1+0.5×0=0.5。于是,0.5的2/3接近0。因此,选择0是最优选择。

从上面的分析可见,尽管0和1是纳什均衡点,但选择。是最优选择。

三、改进博弈论的可能路径

本文已经表明,上述博弈是一个完全信息静态博弈,然而,本实验的实验解(14.61)与理论解(0或1)之间发生偏离。本文认为,有两个主要原因:

第一,博弈论中所假定的理想主体与实际中的决策主体不相符合。理想的博弈参与人是绝对理性人;他们能够进行任何有穷步骤的推理,能够分析所有有穷可能的情况,并且他们的推理、分析是在瞬时完成的,而实际博弈中人们是有界理性的。在我们的博弈实验中若参与者是理想主体,他们能够做本文上一部分那样的分析,他们应当知道0和1是均衡解,也能够预测O是最有可能实现的结果。本实验表明,并不是所有人都能够做出这样分析的。并且,在实际中存在完全非理性的选择,如本实验中选择大于67的3人,这不是完全偶然现象。

第2篇

所谓“博弈”(Game),是指某些个人或组织作出相互有影响的决策,它不仅包括扑克、桥牌等游戏,也包含现实生活中大量的合作和冲突现象。博弈论又称“对策论”,研究的核心是决策主体的行为发生直接相互作用时的决策以及这种决策的均衡问题。

博弈论的原始思想萌芽于2000多年前,中国春秋战国时代的典籍如《孙子兵法》、《孙膑兵法》中都充满了博弈的案例。“田忌与齐王赛马”就是我国耳熟能详的博弈实例之一,但这不过是博弈思想的雏形,现代意义上的博弈论则是20世纪的贡献了。一般认为,1944年同冯·诺伊曼(Von Neumann)和摩根斯坦恩(Morgenstern)合作发表的《博弈论与经济行为》(The Theory of Games and Economic Behavior)提出合作博弈的基本模型,标志着现代博弈论的开始。50年代,博弈论巨匠辈出,纳什(Nash)提出了非合作博弈论,塔科尔(Tucker)定义了“囚徒困境”,从而奠定了现代非合作博弈的理论基石。60后代,泽尔腾(Selten)将纳什均衡引入动态分析,创立了“精炼纳什均衡”的概念;海萨尼(Harsanyi)则把不完全信息引入博弈论研究,随后出现了不完全信息博弈论。至此,博弈论的理论构架基本完成。

博弈论可以划分为合作博弈(cooperative game)和非合作博弈(non-cooperative game)。二者的区别主要在于参与人能否在行为时达成有约束力的协议,达成则是合作博弈;反之,不能强制他方遵守协议,各参与人只能选择自己的最优战略,则是非合作博弈。合作博弈强调团体理性、效率、公平和公正;非合作博弈则强调个人理性、个人最优决策。我们谈到的博弈多指非合作博弈。

博弈有两种划分:从参与人出场的先后顺序来看,博弈分为静态博弈(static game)和动态博弈(dynamic game)。静态博弈指博弈参与人同时选择行动或非同时行动但对前者行动一无所知;动态博弈指参与人行动有先后顺序,且后行动者能够观察到先行动者的选择。从参与人对其他参与人的知识来分析,博弈分为完全信息博弈和不完全信息博弈,前者指每一个参与人对其他参与人的特征、战略和支付函数有确切的了解;后者则恰好相反。将两种分析结合起来,我们就有四种类型的博弈:完全信息静态博弈,完全信息动态博弈,不完全信息静态博弈,不完全信息动态博弈。

1.完全信息静态博弈:纳什均衡

完全信息静态博弈讲的是,假设博弈中所有参与人事先达成一项协议,规定每个人的行为规则,那么,在没有外在强制性约束时,参与人是否会自觉遵守协议。如果参与人自觉遵守该协议,则构成一个纳什均衡:给定其他参与人遵守协议的情况下,没有人积极偏离协议规则。换言之,如果一个协议不构成纳什均衡,它就不可能自动实施,因为至少有一个参与人会违背这个协议,不满足纳什均衡要求的协议是没有意义的。“囚徒困境”(Prisoner's Dilemma)和“性别战”(Battle of theSexes)是任何一本博弈论著作都会提到的纳什均衡特例。

2.完全信息动态博弈:子博弈精炼纳什均衡

动态是世间万物的基本特征。完全信息静态博弈只是一种独特的理想状态。在现实中,当后一个参与人行动时,自然会根据前者的选择而调整自己的选择,而前者也会理性地预期到这一点,所以不可能不考虑自己的选择对他人的影响。1965年,泽尔腾通过对动态博弈的分析,提出了“子博弈精炼纳什均衡”的概念,它要求任何参与人在任何时间、地点的决策都是最优的,决策者应该随机应变,而不是固守前谋。这就推导出子博弈的概念。当参与人的战略在每一个子博弈中都构成纳什均衡时,则形成“子博弈精炼纳什均衡”。也就是说,组成“子博弈精炼纳什均衡”的战略必须在每一个子博弈中都是最优的。

3.不完全信息静态博弈:贝叶斯纳什均衡

不完全信息静态博弈指的是,参与人共同行动,没有机会观察他人的选择。每个参与人的最优战略只能是在给定自己的类型和他人类型依从战略的情况下,最大化自己的期望效用。在项目投标中各承包者的标价高低之争就是一个应用例证。

4.不完全信息动态博弈:精炼贝叶斯纳什均衡

在不完全信息动态博弈中,后行动者观察前者的选择并获得其偏好、战略空间等信息,修正自己的判断;而先行为者也知道自己行为的效用,会有意识地选择某种行动掩盖或揭示自己的真实目的。“黔驴技穷”就是一个不完全信息动态博弈的例证。

国际机制理论的理性主义流派概述

当前,国际机制的研究在理论与实践层面都对国际关系理论学者形成冲击,引起他们持续的浓厚兴趣,并表现出非凡的整合能力,对国际机制研究的不同思路和方法加以整理和批评已经成为学者们重视的工作。德国著名国际机制理论家沃科尔·利特伯格认为,国际机制理论有两种理性主义流派:新现实主义国际机制理论和新自由主义国际机制理论。(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theories of International

Regimes(London:Cambridge UniversityPress,1997),pp.1-2.)

新现实主义国际机制理论的基本出发点是行为体之间的权力资源分配极大地影响着机制的出现、某问题领域机制的存在及其性质,特别是合作中的利益分配;国家会考虑无政府状态下的相对权力,对国际机制的效率形成制约。这些观点都体现在霸权稳定理论中。利特伯格认为,霸权稳定理论是“基于权力的国际机制理论的经典理论模式”,(注:Andreas Hasenclever,Peter Mayer and Volker Rittberger,Theoriesof International

Regimes(London:Cambridge University Press,1997),pp.86.)而克劳福德认为,霸权稳定理论是新现实主义对机制产生最权威、最普遍认同的解释。(注:Robert Crawford,Regime Theory inthe Post-Cold War World:Rethingking Neoliberal Approaches toInternational Relations(Dartmouth:Darmouth Publishing Company,1996),p.57.)霸权稳定理论的基本机制理论主张是:霸权国家建立了自己的霸权体系,并制定该体系的基本原则、规则、规范和决策程序,霸权国的实力与威望是其他国家接受这些国际机制的重要前提;霸权国利用这些机制维持霸权体系,最大限度地获得自己的利益;同时,为了维持该体系,它愿意向体系内的其他国家提供“公共商品”(Public Goods),容忍“搭便车行为”(Free-rider);霸权国的衰落或急剧变化,则该体系的国际机制发生相应变化。

新自由主义机制理论在过去10多年影响巨大,成为分析国际机制的主流理论。其基本机制理论主张是:国家是追求绝对收益的理性自我主义者,只关心自己的得失;承认权力在国际机制中的作用,但认为国际机制是国际关系中的独立变量(independent variable),强调国际机制在帮助国家实现共同利益中的重大作用;活跃在特定问题领域的国家拥有只能通过合作才能实现的共同利益;不确定性是国际机制形成理论的核心,世界政治存在广泛的不确定性。国际机制帮助达成政府之间意愿的契合。行为体相信这种安排会帮助达成互利的安排。换言之,没有国际机制,则协议无法达成。国际机制正是通过降低不确定性来促进国际合作的。新自由主义机制理论是国际机制理论的主流学派,其影响也最大。该派理论用相互依赖的概念将现实主义和自由主义结合起来,具有重要的理论整合意义。

博弈论与国际机制理论

在过去十多年里,国际机制理论在国际合作的分析中独占翘楚,而博弈论在分析社会、经济和政治现象中应用最为广泛。两种理论都以探讨无政府状态下的竞争与合作问题为核心命题。这种平行并非巧合,因为机制理论从博弈论中借取了许多知识能量。理解促进合作的战略逻辑是解释无政府状态下国际机制起作用的关键。在讨论霸权、问题联系、相对收益和相互依赖时,博弈论的解释力有目共睹。这些恰恰是国际机制理论讨论的重心问题。(注:Andrew Kydd and Duncan Snidal,"Progress in Game-Theoritical Analysis of International Regimes",in Regime Theory and International

Relations,ed.Volker Rittberger(Oxford:Clarendon Press,1993),pp.112.)

早期的博弈论分析国际合作的总体问题,其目标在于探究国际合作在无政府状态下如何发生,但对国际机制的特殊作用关注不够,国际机制在合作中的作用没有得到突出和明确的分析。克拉斯纳、基欧汉等使用博弈论分析国际机制的作用,促使现实主义和自由制度主义的国际机制理论逐步成熟。

第3篇

关键词:群体决策;信息集结;博弈论;信息获取;审议;透明性

一、引言

群体决策的研究涉及多个学科,不同学科对群体决策的研究所采取的方法和着重点不一样。在经济学、政治学、管理学领域对群体决策的研究侧重于偏好的集结,较少考虑影响偏好形成的潜在背景信息。其中社会选择理论与公共选择理论利用数学分析的方法和福利经济学的一些基本原理,研究如何“公平合理地”将群体成员的偏好集结为群体的偏好并据以作出群体的选择,这方面的研究源于Condorcet投票悖论的提出,从20世纪50年代开始经过Arrow、Sen、Gibbard和Satterthwaite等人的进一步发展,已形成完整的理论体系,通过对理性社会选择本质的剖析,促进了人们对选举、立法以及政治机构运作等问题的理解。

在管理科学领域,对群体决策的研究主要强调如何通过对群体成员以不同形式表达的偏好的集结,使得群体成员就最终决策达成某种程度上的一致,而一致性则意味着“正确性”,这方面最具代表性的是社会决策图式理论。

在社会心理学领域对群体决策的研究主要采用实验性方法,通过对群体成员之间交互过程的分析研究群体决策的信息集结有效性,一般假定群体成员具有共同的目标,很少考虑决策过程中的策略,心理学研究的主要成果是对群体思维和群体极化现象的分析。

近年来国外出现了不少用博弈论作为理论工具研究群体决策信息集结问题的文献,这些文献主要发表于经济学、政治学与政治经济学期刊,通过对群体决策过程中群体成员的动机和理的分析,给出了一些与人们的直觉完全相反的结论。笔者将对此领域的研究进展从决策信息的获取、审议过程中信息的披 露、透明性的影响与最优决策规则四个方面进行评述。需要说明的是,这四个方面紧密关联,特别是决策群体成员的信息披露动机直接受到决策过程对公众是否透明以及最终的投票表决规则的影响,而群体成员的信息获取动机则部分地取决于信息披露动机,但由于利用博弈论分析群体决策问题的复杂性,现有的文献主要还是相对集中于其中的一两个方面。

文[1]是注意到此领域较早的综述性文章,该文发表于1999年,讨论了当时出现不久的研究政治机构信息集结作用的文献,其中对最先考虑策略性投票表决行为的文[2-5]等进行了简要介绍。同年9月份,《美国国家科学院院刊》发文评述了研究选举的信息集结作用及因投票者私有信息的不准确而导致的策略性投票表决行为的成果[6],其中提及的部分研究工作尚处于未发表状态。文[7]对研究货币政策委员会决策过程中的动机问题的文献进行了系统讨论。文[8]总结了货币政策委员会决策机制设计应该考虑的各种因素,对与群体决策相关的经济学与社会心理学理论与实验分析文献进行了评述,其中讨论了信息集结问题。应该说文[9]是目前评述基于博弈论的群体决策信息集结研究文献较为全面和细致的文章,该文从策略性投票、信息获取、利益冲突和交流四个方面进行了详细评述,并讨论了此领域的研究成果对货币政策委员会决策机制设计的参考价值。

本研究与文[9]的差别在于:第一,文[9]的讨论基本上局限于基于博弈论的群体决策信息集结研究本身,而笔者从研究方法、研究对象与研究成果等方面将基于博弈论的群体决策信息集结研究与经济学、政治学、管理学以及社会心理学领域对群体决策的传统主流研究进行了对比,分析了博弈论作为理论工具研究群体决策信息集结问题的优缺点,并深入探讨了现有研究工作存在的不足之处,也即指出了此领域可能的研究方向,因此,笔者的深度与广度有所超越。第二,文[9]对此领域研究成果的评述思路稍显混乱,文献分类较不合理。第三,笔者特别关注了研究决策过程的透明性对群体成员信息获取与信息披露动机以及投票表决行为的影响的文献,而文[9]对此几乎没有涉及。第四,文[9]发表后此领域出现了不少具有重要参考价值的文献,笔者对这些最新的文献给予了较为详细的评述。

二、决策信息的获取

(一) Condorcet陪审团定理与搭便车问题

与决策问题相关的各类信息一般以分散的、局部的形式存在于社会系统,群体决策的意义之一,是可能更充分地利用这些信息,因而更有可能作出正确的决策。不考虑其他因素,仅从信息集结的角度看,让更多拥有信息的个体参与决策可以改善决策质量,这种观点符合人们的直觉,其形式化证明出自18世纪Condorcet给出的陪审团定理。该定理认为:群体决策可以有效集结信息,在多数决定规则下,增加群体成员数量可以增加作出正确决策的概率,并且随着成员数量趋于无穷,作出正确决策的概率趋于1。

Condorcet陪审团定理及其后来的很多拓展往往都有个潜在的假设:群体决策者所掌握的与决策问题相关的信息是事前外部给定的,或是以零成本获得的[9]。但对于许多现实决策情形,信息并不是不需要投入成本和努力就能轻易得到的,如审稿专家需要付出一定的时间和精力才能决定稿件是否符合录用标准,因此决策者必须决定是否付出以及付出多少代价以获取信息。而在群体决策中,与决策问题相关的信息是公共物品,因而存在典型的所谓社会惰化(social loafing)现象或搭便车问题(freerider problem)。

文[10]对陪审团决策中的信息获取问题进行了研究,认为陪审员的信息准确程度取决于陪审团的大小,更大的陪审团的陪审员具有更少的动机认真听取审判过程,所以更大的陪审团作出正确判决的概率可能更小,从而导致陪审团定理不再成立。文[11-17]进一步研究了群体决策中的理性无知(rational ignorance)问题,对仍能有效集结信息时信息获取成本或成本函数需要满足的条件进行了分析,这些文献针对多数决定规则,假定所有群体成员具有完全相同的决策偏好。其中文[11,13-15]证明,当全体或部分群体成员的信息获取成本函数在获取零信息处的二阶导数为零,则Condorcet陪审团定理仍然有效。

另外,文[18]通过一个仅有两个成员的群体决策模型,指出群体成员间的交流可能会恶化信息获取中的搭便车问题。在该文中,决策成员首先收集关于一项工程实施后果的信息,然后相互交流,再投票表决是否实施该项工程。文章指出,如果交流的作用仅限于信息集结,则交流可能会减少作出正确决策的概率,特别是当高质量的信息很容易获得时,交流会减少决策成员收集信息的动机,加剧信息收集中的搭便车问题,但当信息收集需要付出高昂的代价时,更多的交流通常会增加作出正确决策的概率。

(二)搭便车问题避免措施

因为信息获取活动一般是不可观测的,搭便车者可以通过提供一个虚假的信息假装已经给予了足够的投入,所以无法通过有效的惩罚措施以阻止搭便车问题,只能够从决策群体的成员组成和决策规则等方面考虑避免该问题的发生。

文[19-20]的研究结论从决策群体人员组成方面为避免信息获取中的搭便车问题提供了理论参考,指出具有极端偏好的成员相对来说更具有收集高成本信息的动机,但这两篇文献的研究内容不属于严格意义上的群体决策,因为其中的委员会成员仅负责收集与报告信息,自身并没有决策权。在文[19]中,委员会成员在信息收集之前相互间没有偏好差异,在投入不可观测的努力收集信息后形成各自不同的政策偏好,该文证明最优的委员会规模和总的社会剩余有时会随委员会成员偏好差异期望值的增大而增大,因为预期的偏好差异为成员提供了收集信息的动机。文[20]指出,如果信息收集的成本较低,委员会成员的偏好应该与决策者的偏好类似,这是因为一方面与决策者偏好类似的成员会收集决策者想要的信息,另一方面由于偏好类似所以在报告时不会产生信息的扭曲问题;如果信息收集的成本较高,则委员会应该由具有极端偏好的成员组成,只有这些成员才具有足够强烈的动机付出代价收集信息,但因为信任问题,他们往往只会收集硬信息,即客观上可验证的信息。对于在投票表决前需要对决策选项进行审议的群体决策来说,文[20]的研究结论尤其具有参考价值。

从群体决策机制设计的角度看,如果存在信息获取问题,则机制设计者必须既要考虑如何提供充分的激励促使群体成员获取信息,又要考虑如何有效集结成员所获得的信息,以最大化群体决策的期望效用。

文[21]证明,采用适当保守的决策规则可以促进群体成员收集证据,从而改善决策质量。文[22-23]对存在信息获取时的群体决策最优规则与最优群体成员数量进行了研究。文[22]指出,尽管一致性规则使每个群体成员的投票选择对最终结果都具有决定性影响力,但一致性规则并不能为获取信息提供适当的激励,而且一致性规则特别不适合于信息较不准确的情形,也即更需要群体决策的情形,在只考虑单调纯策略均衡的条件下,除非群体成员的信息足够准确,否则一致性规则或接近于一致性规则的规则不可能最优。文[23]认为,为了提供足够的信息获取激励,对于相当普遍的决策情形,事前最优的决策机制事后可能是非最优的,即不必然利用了所有群体成员获取的信息导致从统计学角度有最优的信息集结,该事前最优的决策机制是在激励成员获取信息与最大程度提取成员信息之间折中的产物。需要指出的是,文[21-23]均假定决策群体成员具有相同的偏好。

三、审议过程中信息的披露

决策群体,尤其是规模较小的群体,一般会在投票表决前对决策选项进行审议,交流各自的私有信息。信息的共享能引起成员信念的收敛。但群体成员通常代表着不同的利益集体,具有不同的利益追求或偏好,因而具有操纵或隐藏私有信息的动机,从而限制了信息共享的可能性,成员间策略性的信息操纵与反操纵甚至导致比纯粹偏好冲突更大程度上的意见不一致。

绝大多数群体决策文献对审议(deliberation)、交流(communication)、辩论(debate)、廉价磋商(cheap talk)等类似表述用语没有进行明确的区分,虽然这些用语在不同场合有一些微妙甚至较大的差异,如文[24]认为审议是辩论的子集。

研究审议对群体决策的影响的文献一般将决策过程建模为两阶段博弈:先审议后正式投票表决,通过对贝叶斯Nash均衡策略和均衡存在条件的分析,研究审议是否以及如何对群体决策发生作用。这类文献一般假定无论是以公共利益还是以私人利益作为评判标准,好的决策选择总是部分取决于世界的真实状态,而世界的真实状态对决策群体成员来说无法确切知道,他们仅不对称地掌握了有关世界真实状态的部分信息。在正式投票表决之前的审议过程可以使群体成员有机会告诉其他成员他们所掌握的私有信息,然后,根据各自已掌握的关于世界真实状态的部分信息,群体成员形成自己对世界真实状态的判断,进而根据自己的评判标准形成各自的决策选择偏好,如果他们的决策选择偏好不一致,就有可能在审议的过程中不披露自己的真实信息,或提供虚假的信息以诱导其他成员作出对自己有利的决策选择。因此,此类文献注重从信息集结角度对完全信息披露均衡和完全信息集结均衡的分析。

Coughlan在文[25]中认为,当所有群体成员的决策偏好完全相同或足够接近,在审议过程中每个成员都具有真实披露私有信息的动机。文[26]则进一步证明,只要群体成员主观上认为多数成员与他拥有共同偏好具有较大的可能性,客观上的偏好差异不会影响信息的真实共享。然而,该文同时指出,审议并不总是能有效集结信息,特别是当群体成员没有较强的先验信念认为自己的价值取向就是群体主流的价值取向时,可能出现有意的相互欺骗。需要说明的是,在文[26]给出的模型中,所有群体成员的偏好或者完全相同,或者完全相反,与此相符的现实群体决策情形很少,甚至几乎没有。文[24,27-28]证明一致性规则在很多情况下为群体成员在审议过程中策略性地隐藏信息提供了动机,多数决定规则比一致性规则能引导出更多的信息共享。文[28]还证明,在相当一般的条件下,审议使得除一致性规则以外的所有其他规则具有相同的序贯均衡集合,也即审议使得所有的无否决权规则在序贯均衡方面等价,从而说明如果群体成员在投票表决前有向所有成员公开宣布各自私有信息的机会,那么采用除一致性规则以外的其他任何决策规则,都会产生相同的决策结果。文[29]对陪审团在审议阶段信息的披露进行了实验研究,以无约束力的意向性投票形式实现信息的交流,实验结果与理论分析基本近似。

另外,文[30]给出了一个两成员的交流与决策模型,两个成员投票表决是否组成具有不确定回报的合伙关系,他们的偏好不一致且为私有信息。文章分析了均衡的特征,发现在均衡时仅有部分信息被传递,交流对于双方的福利是有益的。

对于很多现实决策问题,决策者可能拥有客观上可验证的信息,即所谓硬信息(hard information)。文[31]对硬信息在具有偏好冲突的委员会中的交流进行了研究,证明完全信息集结均衡在偏好为私有信息的情况下比在偏好为常识情况下更有可能存在,即允许更大程度上的偏好差异;另外该文证明,如果信息可验证,完全信息集结均衡的存在条件等同于完全信息披露均衡的存在条件。文[32]指出,在审议阶段群体成员共享私有信息的动机一定程度上取决于其私有信息的可验证性,如果决策成员能够为自己的信息提供验证材料,则一致性规则比其他规则提供了更强的信息共享激励,更有可能实现完全信息共享。文章给出了在一致性规则下审议阶段存在完全信息披露均衡的充分必要条件。

文[33]指出,尽管偏好与信息的差异可能使得部分成员在审议过程中具有错误表达私有信息的动机,但给予群体成员适当的外部激励能消除此类动机,促进信息与偏好的完全集结,而且随着群体规模的扩大,外部激励的强度可以很小,外部激励的具体措施包括对成员决策能力的肯定等。

四、透明性的影响

随着社会的进步,公众对涉及自身利益的重要决策过程的透明性提出了越来越高的要求。透明的决策过程意味着公众可以评价决策群体成员的偏好、能力与贡献,从而引起决策者对自身声誉的关注,而对声誉的关注既可能促进信息的获取和真实信息的披露,但也有可能导致信息传递与投票表决行为的扭曲。

在文[34]中,委员会成员在前一时期表现出的决策能力影响了他在后一时期能否获得连任,而作为委员会成员可为其带来一定的效用。该文证明公开个人投票记录可以促进委员会成员努力获取信息。文[35]认为,仅公布最终决策结果,不公开个人投票记录,会诱导委员会成员按照现有偏见作出投票选择,因此,委员会的决策倾向于保守化,向公众公开成员的投票记录则能够减少现有偏见对决策的影响。该文同时认为,群体决策机制的设计应该不仅考虑决策过程的透明性,也要考虑决策规则的适当性,如果决策规则选择合适,则不透明的决策过程可能比透明的决策过程得到更好的决策结果。在文[34-35]所给出的模型中,都没有考虑委员会成员在投票表决前可能会相互交流各自的私有信息。

在文[36]中,委员会代表公众对一项新工程的实施与否进行表决,委员会成员既关心工程的实际价值,又关心委员会在公众中的声誉,如果维持现状,不实施新工程,则暴露出委员会成员意见的不一致,从而给委员会的声誉带来负面影响,而公众仅能注意到委员会的决策结果,事后不能观测到工程的实际价值。该文证明,在审议阶段,部分成员对声誉的过分关注可能使他们不愿真实披露私有信息,而是夸大工程的价值,导致更容易采取实施新工程的决策。文[37]认为,公开委员会的具体审议记录可能会降低决策质量。由于委员会成员关心公众对其决策能力的判断,使得他们在正式会议交流过程中可能隐藏内部存在的意见分歧,公众对于决策过程透明性的要求,可能导致委员会在正式会议之前组织秘密的非正式预备会议,将真正实质性的讨论从公开的正式会议阶段转移到秘密的预备会议阶段,从而对公众消除委员会内部意见的不一致,而非正式的会议更具有不稳定性,因此,透明性要求并不一定能增加社会福利。

在文[38-40]中,外部利益关联者可以观察到公开委员会每个成员的具体投票记录和决策结果,但对于秘密委员会则只能看到最终决策结果,而委员会成员既关心决策结果又关心外部利益关联者所给予的回报。文[38]和[39]认为,不公布委员会成员的个人投票记录可以减少外部利益关联者对决策的影响,在某些情况下秘密委员会优于公开委员会。文[39]还特别指出,由于随着群体成员数量的增加,单个成员的投票对最终决策具有决定性影响的概率减小,对单个成员而言不诚实投票的代价随之减小,所以对于公开委员会来说,其成员更容易因外部利益关联者承诺给予的回报而不诚实投票,因此Condorcet陪审团定理可能不再成立。在文[40]中,对于秘密委员会,外部利益关联者可以根据投票表决规则的阈值和最终决策结果对委员会成员的投票作出推断。文章分析了秘密委员会的最优决策规则,指出决策规则中增加选择某一选项需要的投票比例可能会导致该选项更容易成为最终决策结果,传统看法认为降低决策规则的阈值可以防止委员会过于保守的看法未必正确,但对于公开委员会则不存在此问题。文[41]虽然不是直接研究透明性,但其研究结论与此处内容相关,该文通过一个博弈模型,说明在特定情况下,外部利益集团可以不用付出任何代价就能操纵委员会的决策。

另外,不少文献从理论与实证两方面研究了决策过程的透明性对货币政策委员会决策的影响。文[7,42]对这方面的文献进行了综述。文[42]区分了三种类型的透明性:决策目标透明性;知识透明性,这里的知识指决策所依据的经济数据或经济模型等;操作透明性,包括委员会会议记录与投票记录的透明性以及决策结果的透明性等。该文评述的文献有部分运用了博弈理论作为分析工具。文[7]专门讨论了货币政策委员会决策过程中的动机问题,指出货币政策委员会的最优规模与透明性等仍有待进一步研究。

类似于文[34],研究透明性对货币政策委员会决策信息集结有效性的影响的文献,一般认为委员会成员希望得到社会公众对其决策能力或决策偏好的正面评价,从而获得连任的机会,如文[43]假设委员会成员希望公众认为他是通货膨胀的强硬抵制者,而最近的文献如文[44-46]等,则假设委员会成员希望公众认为他是具有较强决策能力者。文[44]认为,公开审议过程的详细记录会使得货币政策委员会成员不愿意表达不同的意见,该文通过对美联储联邦公开市场委员会在被要求公开会议记录之前和之后的会议记录的分析说明了理论结果的有效性。文[45-46]分析了投票记录的公开对委员会成员投票表决行为的影响,认为投票记录对公众的透明带来的负面效应占主导地位,透明性不能增加社会福利。

五、最优决策规则

显而易见,不同的决策规则极大地影响了群体决策的信息集结效率,尤其是决策群体成员的偏好或能力不完全一致时,决策规则更是直接影响了群体成员的投票选择行为,进而影响了决策结果的正确性。前述文献大多不同程度地讨论了决策规则的比较和选择,除此以外,另有部分文献对各种情况下的最优决策规则进行了研究。

文[47-48]从最大化期望效用的角度对固定规模的委员会形式集体决策的最优决策规则进行了分析,文[49-50]研究了在特定约束条件下的最优决策规则。然而,这些早期的文献都有个潜在的假设:决策成员仅按照自身获得的信息作出投票选择。文[2,51]等指出,即使决策群体成员的偏好完全一致,也不能保证一定能够如Condorcet陪审团定理所预测的那样有效集结各成员的信息,因为群体成员仅根据自身信息作出非策略性的选择不符合理性要求,当且仅当所使用的决策规则为集结群体成员私有信息的最优规则时,所有群体成员仅按自身信息投票才是Nash均衡,而最优决策规则则取决于特定的决策情形。

文[52]证明,当采用文[48]所定义的最优决策规则时,所有成员仅按照自身获得的信息投票表决形成Nash均衡,但仅按自身信息投票可能不是有效的,因为部分成员联合决定策略性投票可以增加期望效用。文[53]讨论了投票者对不同决策选项具有可用基数表示的效用时的诚实投票问题,试图给出当决策机制允许多种消息类型时诚实投票的准确定义。为使投票者具有诚实投票的动机,文[54]提出了一种在随机选择的投票表决集合上运用多数决定规则得到最终决策的方法,在对所有投票者的表决结果运用多数决定规则和仅对投票表决结果的随机抽样子集运用多数决定规则之间进行随机选择,可以激励投票者诚实投票,从而得到Condorcet陪审团定理的有效性收敛结果。

文[55]基于陪审员的私有信息和策略性表决行为构建了一个陪审团决策模型,证明一致同意规则可能会导致无辜被告得到有罪判决和有罪被告得到无罪判决这两种错误的概率都增加。文[56]分析了决策群体所投票表决的决策选项不独立于投票表决规则的情形:给定决策群体的投票表决规则,提案者向决策群体提出一个要么完全接受要么完全拒绝的议案,群体投票表决是接受还是拒绝该议案。该文证明由于一致同意规则能促使提案者提出更有吸引力的议案,所以增加了决策群体的期望效用,在某些情况下,一致同意规则甚至是Pareto最优的表决规则,因为它也增加了提案者的期望效用,即使提案者与决策群体的利益追求可能完全相反。总结考虑一致性规则的文献[22,24,27,28,32,55,56],可见博弈分析得到的结论往往与人们直观上的认识截然相反,一致性规则是不是合适的决策规则完全取决于特定的决策情形。

既然投票表决规则直接影响了投票者的投票选择行为,那么,对于群体决策机制的设计者来说,他在选择投票表决规则时是否需要考虑投票者在各种表决规则下的投票行为,换言之,机制设计者关于投票者在各种规则下的博弈行为的信念是否会影响到最优决策规则的选择。文[57-58]对此问题进行了研究,其中假设群体成员的决策偏好完全一致。文[57]分析了决策成员的能力存在差异且这种差异是常识的情况下的投票表决规则,指出最优的匿名单调投票规则并不取决于成员是否按照自身信息投票或策略性投票。类似于文[57]的结论,文[58]认为,决策机制设计者对最优投票表决规则的选择与机制设计者关于投票者在不同表决规则下的投票行为的信念无关,在该文中,机制设计者为决策群体选择投票表决规则,其目的是为了最大化决策群体的期望福利,文章证明,仅从信息集结的角度看,关于投票者在各种表决规则下的投票行为的不同假设对于最优决策规则的选择来说,结论是一样的,不同的行为假设导致相同的结论。对于具有相同偏好的决策群体来说,文[57-58]的研究结论大大简化了决策规则的选择。

现实中的决策群体往往存在具有极端偏好的成员,这些成员的存在为信息的有效集结带来较大的困难。文[59]对存在极端偏好者和中立者的群体面对二分决策问题时的最优决策规则进行了研究,考虑了决策成员之间存在转移支付的情况,指出最优投票表决规则相对于转移支付可能性的大小来说是非单调的。文[60]对由两类具有完全相反的偏好的成员所组成的委员会决策进行了分析,对比了一致性规则与非一致性规则的信息集结效率。文[61]给出了一个现实中较难接受的非单调性决策规则――超多数惩罚(supermajority penalty)规则,当选择某一选项的投票过多时,将该选项作为群体决策最终结果的概率反而会下降,该文证明,当对于每个选项都存在极端偏好者时,超多数惩罚规则是最优匿名激励相容规则。

前述文献都假定群体成员的偏好相互独立,而文[62]对群体成员具有相互关联但不完全相同的偏好的情况进行了分析,其中的决策选择空间是连续的,该文分别讨论了采用平均规则与中值规则时所对应博弈的对称贝叶斯Nash均衡的存在性问题,并比较了这两种规则在不同偏好关联程度下的性能。

由于从众心理,群体成员经常会根据对其他成员行为的观察相应调整自己的行为。文[63-64]对从众心理对群体决策的影响进行了研究,其中假定群体成员一方面希望选出好的决策选项,另一方面又希望自己成为胜出的一方。文[63]分析了群体规模较大时同时投票机制与顺序投票机制的均衡特征和信息集结质量,文[64]指出这种从众心理导致同时存在多个均衡,而且对于这些均衡中的多数,信息不能被有效集结。文[64]从某种程度上说明了最优决策规则设计的困难。

六、现有研究工作的不足之处

其一,社会选择理论与公共选择理论以及管理学领域对群体决策的研究,主要考虑偏好集结的有效性,而其中的偏好则是指对决策选项的偏好,这种偏好取决于决策者对最终结果的更根本意义上的偏好和对世界真实状态的信念。在现实社会中,纯粹以偏好的有效集结为终极目标的重要群体决策问题几乎不存在,例如社会选择理论与公共选择理论最重要的应用领域――选举,既是偏好集结(这里指更根本意义上的偏好),更是信息集结。仅考虑偏好的集结问题,不考虑偏好的形成过程以及信息在偏好形成过程中的潜在作用,无法分析群体内外部交流与互动等对决策的影响,无法解释现实中的很多现象,因而对相关决策机制设计的指导作用较为有限。

其二,社会心理学从认知的角度研究群体决策,其结论出自于对实验和经验数据的统计学分析,易于为人们接受。但由于从实验或经验数据中利用统计学方法推导出群体的偏好分布参数极为困难,所以无法深入研究群体决策过程中因偏好不一致而导致的隐藏与扭曲私有信息等策略。

其三,与社会选择理论和公共选择理论一样,用博弈论研究群体决策信息集结问题的文献也是以理性选择假设作为判断与决策的微观基础。尽管所有群体成员严格按照贝叶斯规则更新自己的信念等完全理性假设对于心理学家和普通人来说都是难以接受的,但博弈论文献还是以其数学分析的简洁与严谨颠覆了很多直觉上的认识,通过对群体决策者动机的分析,有助于我们理解决策机制的哪些方面可能会引起不利于决策目标实现的策略,进而有助于决策机制的改进。随着群体成员偏好差异程度和决策问题重要程度的增加,审议方式和决策规则趋向于书面化和正规化,群体思维与群体极化现象将很少出现,决策结果也将更接近于博弈分析的预测。

目前对群体决策信息集结问题的研究尚处于起步阶段,还有很多不完善之处,在某些方面甚至存在根本性的缺陷。

第一,可能是受到信息经济学研究的误导,本领域的很多理论与实验分析文献,包括一些奠基性的文献,混淆了信息与在信息基础上形成的判断。真实信息的披露不会引起其他群体成员以及公众对自己决策能力的负面评价,更不会如判断的披露那样引起认知上的从众,如果决策者掌握了确凿可靠的信息,则其不会因为其他人基于其他信息产生的不同看法而轻易改变自己的信念。

除个别文献外,现有研究群体决策信息集结问题的文献几乎都是将审议完全等同于信息经济学领域的廉价磋商,将交流限制为每个群体成员同时向所有其他成员发送一轮公开的消息。在现实群体决策过程中,审议至少包括对各方面提供的信息的真实性的审议,以及对信息与世界真实状态之间的逻辑关联(即潜在的决策模型)的审议。因此,将审议建模为完全的廉价磋商的现实意义极为有限,对于偏好差异较大的群体更是如此。

第二,客观上难以验证的信息的可接受性,取决于接收者对于信息发送者的偏好的信念,例如,人们有充分的理由怀疑垄断企业单方面提供的企业运营成本数据的真实性。另一方面,在很多情况下,信息的软硬程度(可验证程度)与信息获取者和信息接收者的成本投入相关。因此,群体成员获取可验证信息与不可验证信息的动机,以及群体成员对信息软硬程度的投入,既取决于是否有审议阶段以及审议方式和决策规则,也取决于群体成员的偏好和群体成员关于群体偏好差异程度的先验信念。诸如此类问题现有文献几乎没有涉及。

群体决策在现代社会无处不在,如政府部门对重大战略性问题的决策、公司董事会对重要项目投资与实施问题的决策、审判委员会对犯罪嫌疑人的判决、专家对科学基金项目申请书的评审等。从组织或社会的目标出发,针对特定的决策问题,为了尽可能作出正确的决策,应该如何组成决策群体,选择何种决策规则?此类群体决策的科学化与民主化问题很久以来一直是管理、政治、法律和经济等领域讨论的中心,其研究结果对于各类政治、社会、经济组织的运行机制设计具有重要的意义。

中国学者对群体决策的理论与方法进行了大量的研究,提出了不少新的概念和方法,作出了很多重要贡献,国家自然科学基金委员会对群体决策理论与方法研究也较为重视,曾将其列为优先资助领域。但根据现有的各类文献和历年的基金项目研究摘要,总体感觉国内对决策群体成员的动机和理考虑较少,到目前为止还没有发现国内其他学者利用博弈论研究群体决策信息集结问题。

笔者试图利用不完全信息博弈论和机制设计理论,研究决策群体成员的策略性信息获取、信息传递和投票表决行为,揭示决策群体人员组成、审议方式、决策规则、透明性等决策机制的各个方面对群体决策的信息集结有效性的具体影响。并试图从信息集结角度,为一些典型公共决策情形优化决策机制。

参考文献:

[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

第4篇

【关键词】博弈论;社交网络;访问控制;SNS

1、引言

随着移动通信、光纤通信、云计算、多媒体等技术的快速发展,有效促进了社交网络平台的普及和应用,已经诞生了QQ、微信、微博、BBS、Twitter、Facebook等社交网络平台,这些社交服务采用了SNS模式,可以为人们提供交友、购物、学习等多种服务,扩大了人们生活交际的渠道和平台,进一步改善人们的生活质量和水平[1]。社交网络发展过程中,访问控制一直是人们研究的重点,论文基于笔者多年的研究,详细地分析了社交网络应用发展过程,探讨了基于博弈论的社交网络访问控制应用设计功能,构建完善的用户信任机制、损益机制和病毒防御机制,能够提高社交网络访问控制能力和成效。

2、社交网络应用分析

随着Web2.0的诞生,人们社交服务采用的SNS平台已经得到了广泛应用,其以人为本,具有真实化、个性化、互动性等多种特征,目前已经诞生了多种SNS网站,比如LinkedIn、微博、BBS等[2]。具体的社交网络应用发展包括以下几个方面:

(1)高校型SNS平台。高校SNS平台发展起步较早,一直走在社交网络的前言,目前常用的高校社交网络平台为人人网、BBS、Facebook等,扩展了高校学生交友、学习、就业渠道,丰富高校学生的精神文化生活,

(2)商务型SNS平台。商务交往是企业发展的重要途径,商务活动是企业推广产品、市场营销的重要任务,构建商务型SNS平台,可以为企业构建商务圈,为企业发展提供合作交流、洽谈渠道,目前最为常用的商务SNS平台为LinkedIn,该平台拥有将近7500万家企业入住,涉及电商、旅游、工业、农业等多个领域。

目前,随着SNS服务平台引入更加先进的推广技术,社交网络在各个领域如雨后春笋,诞生了饭否、美团、占座等多个平台,覆盖了人们工作、生活和学习的各个领域,促进了人们生活信息化、便捷化,具有重要的作用和意义。

3、博弈论在社交网络访问控制中的应用设计

3.1构建完善的用户信任机制

目前,许多网络构建信任机制常用的方法是根据网络节点操作记录,判定使用主体可信度[3]。社交网络用户信任可以利用博弈论的网络节点信任数值计算方法,确定用户的信任度,计算过程中利用的数据包括用户注册时间、发帖数量和朋友圈人数等,具体的计算方法如下:

(1)用户驱动方法。用户驱动方法可以根据自己的社会关系、朋友圈确定用户信任度,比如用户和朋友圈的许多人都拥有一个共同好友,则该好友的可信度就判定为较高,比较符合用户的实际情况,具有较高的灵活性。

(2)机器驱动方法。机器驱动方法可以通过SNS平台的发现机制、推荐机制进行执行,平台可以搜集用户的详细信息,利用用户的浏览记录、消费记录等行为,统计计算用户的信任值,可以迅速、客观、简单地分类用户,具有自动推荐等特点。

(3)混合驱动方法。混合驱动方法在集成用户驱动、机器驱动等方法的优点,自动计算和确定用户信任度,为用户推荐朋友圈,并且通过用户判定之后方可建立信任机制,提高了信任可识别性,具有重要的作用。

3.2构建用户损益机制

社交网络用户损益是通过朋友圈人数进行确定的,朋友圈人数越多,收益越大,朋友圈人数越少,损失就越大。但是,用户朋友越多,个人信息和隐私泄露的概率就变大,为用户信息带来了较大的风险。构建用户损益机制,可以防止网络欺骗,鼓励用户之间真诚交流。基于博弈论的用户损益机制包括欺骗与非欺骗服务、诚实与拒绝服务等博弈策略。如果用户认为来访人员带来的损失超过收益,存在欺骗访问行为,可以通过网络将举报信息发送至服务器或管理员处,通过监管对访问人员进行惩罚;当系统认为收益超过损失,判定为诚实访问,将其列入到用户的朋友圈,扩展用户的朋友圈人数,提升用户收益。基于博弈论的用户损益机制可以较为准确地识别欺骗访问、诚实访问,强化欺骗访问的处罚力度,促使用户不能使用社交网络实施欺骗行为,减少欺骗用户数量,提高诚实访问用户数量,促进社交网络能够健康运行和发展。

3.3构建网络病毒防御机制

随着社交网络服务平台的普及,其在为人们带来高质量、信息化生活的同时,也为人们带来了潜在的安全威胁,造成人们的信息丢失,进而钱财、生命安全受到侵害,严重的损害了社交网络正常运行和发展。基于博弈论的网络病毒防御机制可以将用户进行分类,分别是合法用户、攻击威胁用户,这两种用户属于非合作性质的博弈,一方的损失必然伴随一方的获利,是一种非零和的博弈,两者之间的损失和收益是不对等的,并且博弈策略偏向维护合法用户,也就是收益时对合法用户影响较大,损失时对攻击威胁用户影响较大,这种策略可以阻止网络攻击,降低病毒对社交网络合法用户的侵害,具有重要的作用和意义。

4、结束语

随着社交网络平台的快速诞生,社交网络保存了海量的用户信息,因此亟需提高访问控制管理水平,以便保证用户信息的安全性。论文基于博弈论设计了一种访问控制方法,可以构建用户信任机制、损益机制和病毒防御机制,更加符合人们参与社交网络的应用背景,提高人们社交服务的信息化水平,具有重要的作用。

参考文献

[1]孟宪佳,马建峰,王一川,等.面向社交网络中多背景的信任评估模型[J].西安交通大学学报,2015,49(4):73-77.

[2]陈庆丽,张志勇,向菲,等.面向多媒体社交网络的访问控制模型[J].西安电子科技大学学报:自然科学版,2014(6):181-187.

[3]刘娜,叶春晓.线上社交网络访问控制模型综述[J].计算机系统应用,2014(5):1-7.

作者简介

郝宗波,男,汉,19770528,籍贯四川,副高级,研究方向:社交网络、软件工程。

第5篇

【关键词】 博弈论 电力项目 管理方法 创新

随着经济的进步和科技的发展,电力市场逐渐繁荣和发展起来,电力建设项目增多。电力项目管理需要实现对电力工程成本、质量以及工期的管理,传统的电力项目管理方法很难实现对三大控制目标的有效平衡,很多情况下,电力企业为了保障电力项目质量,就要加大成本的投入,或是为了赶工期而忽视质量,这样不利于电力项目的建设。博弈论在电力项目管理中的应用不仅可以有效的解决这一难题,还会实现电力项目管理方法的创新。

1 国内外电力项目管理方法概述

(1)我国传统的电力项目管理方法。受技术和成本的限制,我国电力项目管理大致上经过了三个发展阶段,首先是建国初期的统包统管和外商包建模式,电力项目管理的重要性没有得到充分的认识,建设单位往往投入较大的成本,项目管理的专业化太低,电力项目管理的整体水平不高。其次是三方体制和指挥部模式,这一模式还是具有协调难度较大和管理水平较低的问题。自1988年以来我国开始学习工程项目管理模式,对电力建设市场进行了相应的改革,资本金制、法人责任制、工程监理制、招标投标制以及经济合同制逐渐应用到电力项目的建设过程中,电力项目的管理方式有了一定的进步和创新。

(2)国外电力项目管理方法。国外比较传统的电力项目管理模式是业主方进行项目管理。近年来,快速轨道方式以及阶段发包模式得到了快速的应用,该种管理模式可以最大限度的缩短工期,节省工程项目成本。BOT建造、运营以及移交管理模式是一种依靠私人资本进行基础设施建设的项目管理方式,代建制模式是依靠政府招标来选择合适的项目管理单位。电力项目管理模式不一而足,建设单位要根据工期、成本以及质量的问题,综合各种因素进行选择。

2 我国传统电力项目管理方法中存在的不足

随着改革开放的深入和电力市场的繁荣和发展,工程项目监理制度和招标承包制度逐渐引入了电力项目的建设市场,电力建设可以优先选择信誉较好的施工单位,这对提高电力项目工程的施工质量、提高投资效益以及进行科学决策都是有利的。但是,该种电力项目管理方式中,电力项目承包商和业主之间是对抗关系,承包商中标的价格较低,承包商以及业主在履行合约的过程中经常会遇到索赔问题。

(1)合同订立的问题。由于业主和承包商之间的对抗关系,只有规范化和精细化电力项目承包合同,一些模棱两可的问题才能有效的避免。由于电力项目的建设涉及到气候、地质和水文等很多不可控因素,在这种情况下,电力项目承包建设合同的条款越来越细,但是在电力项目的建设过程中,还是存在一些问题。业主和承包商均将合同作为争夺利益的方式,在一些问题不能及时解决的情况下,很容易引发问题甚至是诉讼。

(2)项目转包现象普遍。电力项目建设涉及的地区范围较广,很多电力项目建设的工期较长,电力项目建设过程中分包和转包的现象普遍。这也直接导致了不重视合同、体制和观念落后、法律法规不健全以及管理角色定位错误的问题,电力项目的施工质量、施工进度以及成本都很难控制。电力项目建设的损失较大。目前,我国虽然引进了工程招标投标制度,但是工程承包模式以及工程建设监理的模式还没有得到真正的解决,电力项目管理还存在众多的问题,现有的电力项目管理方法不能满足电力项目建设国家化的要求。

3 基于博弈论的电力项目管理方法新模式的提出

(1)博弈论概述。对于博弈论的研究始于19世纪,经济学家对金融寡头问题进行了深入的研究,1944年《博弈论与经济学》一书系统的阐述了博弈论理论体系,博弈论不仅在数学领域、经济学领域得到了快速的发展,还在经济、政治、生物进化等领域得到了重要的应用。博弈论在项目管理中的应用则是指通过承诺、协议和制裁而具有约束力。博弈是利益的分配,博弈论在电力项目管理中应用可以创新管理模式和管理方法。近年来,相关专家都对博弈论在电力项目管理中的应用进行了深入的研究,对质量、成本和工期项目管理对象进行了分析,并对施工行为和监理行为进行了分析。目前,博弈论在电力项目管理中的应用虽然是还没有系统的论证体系,但是博弈论可以改变电力项目管理中业主和承包商的对抗关系,促进双方之间信息的充分交流,实现双方利益的共赢。博弈论在电力项目管理中的应用不仅可以改善项目管理参与方信息不对称的问题,还可以降低信息交易成本,实现利益的共赢。

(2)基于博弈论的电力项目管理方法的提出。电力工程项目的建设也需要实现利益的最大化,参与方利益的共赢已经成为各方的共识。电力项目施工人员如果一天的工作结束之后拿到当天的工资,那么施工人员的工作积极性会大大的提升,项目管理人员还需要对项目进行定期的评价,针对项目管理中存在的诸多问题进行及时的调整,选择合适的解决方法,实现项目动态的管理与参与方信息的共享,进而实现项目参与各方利益的共赢。目前,基于博弈论的电力项目管理方法已经在一些电力工程项目建设中得到应用,项目管理方式也在不断的创新和进步。

4 基于博弈论的电力项目管理方法创新与实践

(1)团队的建设。随着社会用电量的增大,电力项目的建设已经得到了快速的发展,电力工程建设市场逐渐繁荣。但是,目前无论是电力项目管理人员还是施工人员都存在稳定性差、施工人员素质差以及投入与产出严重失衡的问题,这不利于电力项目管理方法的创新和进步。因此,电力工程建设单位要塑造良好的形象,只有提高了电力建设项目的效益,电力项目参与各方才能都获得收益。电力建设项目管理人员还要深入学习博弈论的内涵和意义,对质量、成本以及工期进行之间的影响与被影响关系进行深入的研究,提高管理的水平,提高管理的能力,减少成本的支出,拓展管理信息与专业技术的共享范围。

(2)信息传递方式的改变。参与方只有加强信息交流,缩短信息交流的时间,电力项目的建设和发展才能得到新的进步。基于博弈论的电力项目管理方法更有利于信息的交流和传递,避免施工过程中的信息不对称问题。目前基于博弈论的电力项目管理新方法已经逐渐应用到电力项目的建设和管理中,电子信息技术的应用加快了信息交流的速度,项目参与方可以实现方便和灵活的信息交流,降低信息传递成本,有利于参与方针对项目建设中出现的问题进行及时的协商,降低成本支出。

(3)合作机制的构建。基于博弈论的电力项目管理方法需要利益各方的信息交流和合作,合作的水平和程度取决于电力项目合作机制的运行状况。博弈论在电力项目管理中的应用需要管理人员对质量、成本以及工期进行综合的考量,对传统的项目管理方式进行创新和优化,实现更加主动性、组织性、计划性以及结构性的合作机制的建设,强化项目建设各方的协作和合作,对项目的投入和产出进行更加深入的研究,发挥项目管理人员在资源效用、技能以及经验方面的能力。此外,参与各方还要进行协商机制的建设,对出现的问题进行及时有效的解决,实现信息一体化、透明化以及讨论的实时化,实现电力项目管理人员在职业经验和技术技能经验的共享。

(4)激励机制的构建。项目管理的目的就是实现利益的最大化,施工人员是电力项目管理中的重要因素。电力项目管理的过程中可以引入激励机制,逐步创建内部激励和外部激励机制,可以对施工人员进行物质上和精神上的奖励,在充分考虑电力项目管理影响因素的基础上实现各种激励机制的结合,在各方利益的博弈中实现投资效益的最大化。

5 结语

随着经济的发展和人们生活水平的提高,社会的总体用电量呈连年上升趋势,电力建设项目逐渐增多。质量、工期和成本一直是工程项目管理的三大控制目标之一,电力项目的质量、成本和工期也是各方利益综合博弈的结果。很多情况下,电力企业为了保障电力项目质量,就要加大成本的投入,或是为了赶工期而忽视质量,这样不利于电力项目的建设。博弈论在电力项目管理中的应用不仅可以有效的解决这一难题,还会实现电力项目管理方法的创新。

参考文献:

[1]索迹,祁春清.博弈论在电力市场中的应用[J].科技信息(科学教研),2011(11).

第6篇

Key words: sports,game,equilibrium solution, teaching method

中图分类号:G633.95;G633.96

引言

近几年,随着我国高等教育向着大众化方向发展,人们对高职教育开始重视起来,高职教育也得到了迅猛的发展,全国相继成立了许多公办或者私立的高职院校,高职学生也就变得越来越多。因此正确分析和了解当前高职学生的特点,选择适合这些学生的教学方法和内容,努力做好课堂的教学和管理工作就显得尤为重要。

体育教学有三项任务:一是增强体质;二是掌握体育知识、技术、技能;三是进行思想品德教育[3]。因此,如何更好的开展体育教学,实现这些教学任务显得很重要。本文通过应用博弈理论来研究高职院校体育课堂中学生的心理活动和行为,教师可以选择合适的教学方法和内容来实施教学,从而提高体育课程的教学效果,达到教师学生都受益的效果。

一、体育课堂中的博弈理论

博弈论考虑游戏中的个体的预测行为和实际行为,并研究它们的优化策略。博弈中应该包括博弈主体,策略集以及收益函数。而在体育课堂中就存在博弈双方:教师和学生。教师上课所采用的教学方法和考评方法就是教师的策略集,而学生上课采取的学习兴趣和态度就是学生的策略集。教师和学生在课堂结束后都会获得相应的收益(教师的收益包括课时收入、情感收入,而学生的收益就是课程成绩和身体的锻炼)。在这个教学过程中,教师和学生都追求最大收益:教师希望学生有兴趣学习运动技能,在学会技能的同时锻炼身体,顺利完成课堂教学;而学生希望在体育课堂上,玩得好,还学会教师所教的体育技能,取得好的体育成绩的同时让身体得到锻炼。

二、体育课堂中的博弈模型

由前面的分析可以知道教师和学生都希望自己的收益最大化,下面给出教师和学生的收益矩阵。

首先我们做如下假设:

表示教师上课的工资收入, 表示教师上课的情感收入(教会学生运动技能有成就感), 表示教师认真上课的成本投入(包括备课,体力消耗等), 表示就是不认真上课的成本投入; 表示学生认真上课取得的好成绩, 表示学生不认真上课取得的成绩, 表示学生认真锻炼的身体收益, 表示学生不认真锻炼的身体收益, 表示学生认真锻炼需要付出的成本(包括体力消耗等), 表示学生不认真锻炼需要付出的成本(包括体力消耗,课堂惩罚和挂科后补考需要付出的精力消耗和金钱消耗)。

从以上收益矩阵可以看出,要想得到该博弈的均衡,必须确定 和 的大小关系,以及 和 的大小关系。而考虑现实情况我们可以得出 > ,

> 。因此,这个博弈的均衡解为(认真,认真)。此均衡表示,在体育教学过程中教师认真上课,学生有兴趣上体育课,并且认真的学习运动技能,这样教师和学生都能得到最大收益。

三、体育教学方法研究

根据我们上面分析的体育课堂教学中教师学学生的博弈模型结论看以出,要想达到理想的教学效果,

需要教师和学生共同努力,而教师的付出占主要位置。因此,体育教师就需要多研究课堂教学方法,然后根据学生特点采取合适的教学方式。

(一)分组教学法[1]

教学过程中进行合理分组,可以使课堂教学生动活泼,充满竞争和欢笑,并能充分发挥学生的主体作用,激发学生学习潜能,摆脱过去那种生硬呆板的行政分组,简单而笼统的分组轮换所带来的沉闷消极的心理空间和课堂氛围。而分组教学的目的是追求高效益,优化课堂教学结构。因而,分组教学必须从教材内容、场地器材等客观条件出发,尤其要切合学生实际进行分组,过多或者过于频繁的分组轮换反而有害教学。其次,分组教学应该注意灵活性。在明确教师主导地位的前提下,分组教学应该充分发挥学生的主体作用,让学生有选择分组形式的较大的自主权,以激发学习兴趣,将原来的“要我学”改变成“我要学”。分组方式可以采取以下几种:性别分组法、行政分组法、体能分组法、兴趣分组法、友伴分组法、随机分组法、补偿分组法、健康分组法[2]。

(二)游戏教学法

游戏教学具有很强的趣味性、娱乐性、综合性、教化性的特点,也具有锻炼身体的价值,它能够把我们的教育目标潜移默化地融入到其中。体育课堂教学以游戏开始往往可以激发学生的兴趣,而每个学生都希望自己的能力得到表现,让别人了解自己的长处,从而得到别人的赞同、认可和尊重。在体育游戏愉快的竞争和对抗中,他们能够很自然地表现出自己的体力、技能与智慧,从而得到快乐的体验,品味到成功的喜悦。这样开始的教学,不但有利于培养学生良好的道德品质,而且能够发展学生智力,培养学生的身体基本活动能力运动技术和技能。但是在教学中必须选择合适的游戏,让它发挥正向作用,选择原则包括:锻炼性原则、教育性原则、趣味性原则、安全性原则。

(三)联系实际法

体育课不应该只是教授学生运动技能,还应该渗透各个方面的教育。所以体育教师可以在教学中给学生讲解体育与就业的关系。现在许多企业和单位都注重体育活动,经常参加体育竞赛,或者举行内部竞赛,这样企业和单位在招聘员工时便倾向于那些既专业对口又有体育特长的人员。因此,学生如果学好专业课的同时,能在体育课堂上积极认真的学习运动技能,比如篮球、排球、羽毛球、乒乓球等,并在平时多加练习,便可在这些企业招聘中脱颖而出,走向理想的岗位。

(四)激励教学法

体育教师在课堂常规教学中,可以多鼓励学生,当学生做练习的时候,多给与评价。做的好就表扬,或者给与物质奖励。做的不好也不要批评,而是指出错误,再亲身示范,让学习更好的学习技能。

四、结论

第7篇

关键词:博弈论图书馆数字资源资源共享

中图分类号:G251 文献标识码:A 文章编号:1009-3044(2016)29-0017-03

随着大数据时代的到来,信息的互联互通成为提高信息服务能力的重要前提,任何一个图书馆都难以同时满足不同学科专业、不同层次用户的信息需求,也不可能实现对所有资源的收集和管理,数字信息资源共享就是为了解决个体图书馆信息资源的有限性和信息需求无限性的矛盾而采取的图书馆间合作建设与发展的策略。现阶段,我国文献信息资源共享的理论研究主要集中在文献资源的布局和配比方面,因此多将信息资源共享效率低下的症结归于管理体制的不完善、技术手段的落后和宏观调控的缺乏。信息资源共享是追求自身效用最大化的过程,是一种分析投入成本和产出收益的博弈过程,通过借鉴博弈论的研究方法,从图书馆个体利益和共享集体利益的关系出发进行研究,可以进一步认识阻碍数字信息资源共享的因素,并找到解决这些问题的方法和措施。

1博弈论概述

1.1博弈论的涵义

博弈论,也称对策论,英文为Game Theory,是根据信息分析及能力判断,研究多个决策主体之间行为的相互影响作用,以取得收益或效用最大化的一种对策理论。其中的“博弈”是指个人、队伍或组织,在一定的环境条件及规则下,同时或先后、一次或多次,根据环境和竞争对手的情况变化,从各自允许的行为或策略中进行选择、加以实施,并从中取得相应结果的过程。中国早在几千年以前就已存在博弈思想,田忌赛马的故事就是较好的博弈论案例。自20世纪80年代,博弈论得到了广泛的应用,尤其对信息经济学的发展做出了重要的贡献。

1.2博弈论“囚徒困境”经典模型分析

博弈论经典模型囚徒困境建立在一个假设之上,即甲、乙两人被怀疑是合伙的偷盗犯,警方虽逮捕了他们但没有掌握充分证明两人犯罪行为的证据,警方将其分开单独审问,双方不能进行信息的交流。警方对这两个嫌疑犯的量刑原则是:如果一方坦白,另一方不坦白,则坦白者从宽处理,判刑1年;不坦白者从重处理,判刑7年。如果两人都坦白,则每人判5年刑。如果两人都不坦白,则警方由Tile据不足,只能对每个人各判刑2年。表格1中的框图体现了这个博弈的分析过程,左方是甲的可选择策略,上方是乙的可选择,双方均可做出坦白和不坦白两种选择。其中包含数字的格对应甲乙的一个策略组合,每格第一个数字代表甲的报酬,第二个数代表乙的报酬。比如第二个数字格是指当甲坦白,乙采取不坦白的策略时,甲的报酬为-1,乙的报酬也是-7。图中的报酬均为负数,以表示判刑的年数。

在警方交待了量刑原则以后,会从自身利益出发进行分析,选择坦白或不坦白的策略,此时双方展开了博弈的过程。首先分析甲的思考过程,当甲进行决策选择的时候一定会先考虑乙的想法。根据图表1的矩阵图可见,当囚犯乙选择了坦白的策略时,囚犯甲坦白则获刑5年,不坦白获刑7年。由此,当乙选择坦白时,甲必然选择坦白(因为5

如果仔细分析囚徒困境报酬矩阵,甲乙双方若都作出不坦白的决定,会得到更好地结果,即各判刑2年。可是因为没办法进行信息沟通,每一方都会担心对方坦白但自己不坦白时会受到重判(即对方坦白获刑1年,自己不坦白则被判7年)。因此,每个囚犯都从个人利益出发考,最终的结果都会选择坦白坦白,(坦白,坦白)便是囚徒困境博弈模型必然的均衡结果。

囚徒困境的结论折射出的道理发人深省,从个体的视角思考做出的占优策略决定(-5,-5),显然劣于做出合作策略的选择(-2,-2)。换句话说,从单个个体的角度出发得出的占优策略,从整体而言得出的却是最不理想的结局。囚徒困境最终达到的策略均衡,体现出了个人理性和集体理性的矛盾冲突。目前,图书馆在数字信息资源共享问题上也存在着类似的矛盾,我们将“囚徒困境”的博弈分析方法运用到资源共享问题上,也可以解释合作的不稳定性及相关问题。

2图书馆数字信息资源共享的博弈分析

2.1数字信息资源共享的静态博弈

数字信息资源共享一直是图书情报界关注的重大课题,每个图书馆都有资源共享的愿望,图书馆信息资源的共享,可以实现整体效用的最大化。假定参与共享合作博弈的图书馆为A、B两个,分析图2矩阵可以发现,如果A、B馆都选择合作策略,每个参与者均可获得收益为10,总报酬最大为20;如果A、B两者中有一方选择合作,而另一方选择不合作,参与者报酬分另4为6、12,总报酬为18;倘若A、B两馆都做出不合作的选择,那么各馆报酬都是8,总报酬16是最小值。可见(合作,合作)策略是团体利益最大的策略选择(20>16)。

事实上,一些图书馆为了自身的利益,往往从个人理性角度出发,最终与团体利益冲突,陷入“囚徒困境”。类似于囚徒甲、乙的决策过程,A馆会根据B馆的决策选择策略,当B选择合作策略时,A若选择合作可得10,A若选择不合作,既省去了共享资源需付出的成本,又无偿享受了B馆提供的信息资源,报酬是12。因此,A必然不会合作(显然12>10)。同理可推得,B做出了不合作的选择时,A仍然会选择不合作策略(因为8>6)。显而易见,无论B做出合作或者不合作的选择,A都会采取不合作策略。同样的分析结果对B馆也是适用的,最后的博弈结果为(不合作,不合作),这时总报酬16,小于最优策略的总报酬20。

这一博弈矩阵可以看出,大家最初都希望达到(合作,合作)总报酬为20的结果,但是通过报酬矩阵分析可见,即便已经签订合作协议,各自馆也会抱有“搭便车”的心理,就是如果你合作我不合作,我就可以占到便宜(12>10),于是各自违背共享约定,形成了图书馆资源共享博弈的(不合作,不合作)结果。

上述两种博弈均为一次性博弈,参与博弈者都只能进行一次选择决定,另外博弈参加者在做出自己决定的时候并不清楚对方的决定,大家都是同时决定自己的一次性策略选择。处在这样的前提之下,参与者都做出了自己的策略选择时便已完成了一个完整的博弈过程,并得出了最终结论,这种博弈称为静态博弈。在静态博弈中,出于个人理性的策略选择往往导致了从整体而言的最坏结果。一方面,在达成合作协议以后,参与者都会有投机的心理,并从自身利益出发暗地选择了不合作的做法。另一方面,对于一次性的博弈,只要参与者做出了最终决定便完成了博弈过程,对于违反约定的行为没有补救和惩罚的有效措施,无法通过后续的博弈进行调整和制约。

2.2数字信息资源共享的动态博弈

实际上,博弈通常为一系列重复进行的运动,即相对静态博弈而言的动态博弈,在连续进行的动态博弈中,上面结果会有所不同。

2.2.1数字信息资源共享的无限次重复博弈

无限次重复博弈是指相同结构的博弈可以无限次地重复进行下去。如果设定在数字资源共享的无限次重复博弈中,不管哪一方图书馆在其中的一轮合作博弈中采取了不合作的行动,在以后的博弈中便会遭到其他馆“不合作”的报复策略,而且这一不合作策略会在未来的所有博弈中重复下去,长此以往,首先违约的一方便永远失去了与另一方合作的机会。因为在无限次重复博弈中,存在着对欺骗和违约行为报复的机会,因此参与合作的各方会担心采取不合作策略给自己带来的长期损失,不会主动选择不合作的策略,使得数字信息资源共享合作得以维持。

继续用图2加以说明,对于图书馆A,各馆如果一直处于合作的状态,便可以长期获得报酬10,累积起来10+10+10+…,但如果抱有机会主义的想法,打破约定选择了不合作的策略,他的确获得了一次性的利益,得到报酬为12,但在以后的无限次重复博弈中,均会受到对方不合作的报复行动,收益只能为8。为了一次性的好处,使得日后的收益从原来合作策略时的10+10+10+…下降为不合作策略时的8+8+8+…。显然,任何一个图书馆在数字信息资源的无限重复博弈中,为防止被报复而丧失长期的经济效益,都会遵守协议,采取合作的策略。

2.2.2数字信息资源共享的有限次重复博弈

在有限次重复博弈中,假设事先约定只合作5次,用逆推法进行分析,各方均知道第5轮博弈是最后一轮博弈,因此这一轮博弈便同静态博弈无异。根据前面的分析,这一轮的违约不可能在以后受到惩罚和损失,那么,每个图书馆出于个人理性出发选择的占优策略就是不合作的结果。逆推到第4轮,因为大家都可以推算出第5轮不合作的结果,因此第4轮博弈也会采取不合作的策略。由此类推直到第1轮,都可以得到同样的结果。显然,在有限次重复博弈中,图书馆数字信息资源的共建合作是不稳定的,博弈的最终均衡策略为(不合作,不合作)。

3用博弈论的思想解决数字信息资源共享问题

在现实生活中,参与博弈的各方合伙的机会必然是有期限的,信息组织间的合作共享是否根本无法实现呢?显然在现实生活中是存在着长期合作的共同体。事实上,无限次重复博弈的主要界定标准在于参加者均不清楚哪一轮博弈会是最后一轮,合作各方担心违约会遭到日后的“报复”便会把合作策略坚持下去。在有限次的重复博弈中,如果合作双方不确定哪一轮是最后一轮,参与者会认为日后还要继续打交道、博弈状态会继续维持,这便同无限次重复博弈无异。所以,在不能确定终止期的有限次重复博弈的图书馆数字信息资源共享博弈中,合作解是可以存在的。当然,为了维护合作模型的稳定性,更好的实现团体利益的最大化,必须配合以必要的措施。

3.1建立信任机制

图书馆信息资源共建共享机制的成功建立,取决于成员间的相互信任和对于联盟内部规则的遵守程度,能够取得收益同时实现持续的发展,其中成员馆之间的信任是至关重要的。成员间除了应相互理解对方的行为和立场,尊重对方的观点,还应加强组织内的交流,达成对某些问题的认识。另外,信任评审机制的建立也十分必要,通过建立完备的综合性、长期性评估测试标准系统,对成员的联盟策略及行动影响因素进行持续地跟踪测评,通过完善细致公平的执行制度,形成稳定可靠的运行机制。

3.2建立监督机制

对于合作中的各馆,都希望采取最优于自己的策略,以期得到最好的结果,因此为了达到合作团体利益的最大化,应该对各成员进行有效监督,维护合作协议的顺利执行。要在建立领导协调组织和健全监督机制上下工夫,在明确各成员权利义务的基础上,监督各成员的行为。对于损人利己的倾向和行为,及时采取措施,必要时对违反合作协议的成员进行制裁,甚至终止合作。

3.3建立保障机制

因为各图书馆之间的规模与发展水平不均等,建设规模大、信息丰富的图书馆往往很难与信息量相对较少的图书馆实现资源共建共享,另外数字信息资源共建共享经常发生“搭便车”的问题,这些都需要通过建立保障机制加以制约。在内部评估制度规范的基础上,对贡献大的图书馆要采用奖励的办法进行收益补偿,同时针对慵懒的图书馆,通过采取惩罚的方式实现督促作用。

在具体的实施上,以惩罚措施为例,在成员馆签订共享协议时,规定不合作的一方会受到经济制裁,报酬减3,在矩阵图2的基础上可以得到新的报酬矩阵(见图3)。按“囚徒困境”的分析思路,如果A馆选择共享,B馆选择了不共享,B得报酬为9而不是原来的12,因为B馆不共享受到了事后的经济制裁(12-3=9),小于(共享,共享)中的报酬10,可见,B怕受到惩罚得不偿失必然选择共享。对于A的分析也是如此,最后的博弈均衡状态一定是(共享,共享),克服了欺骗或违约行为,达到了信息资源共享的目的。