时间:2023-03-08 15:35:13
序论:在您撰写博弈论论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
目前,当代大学生诚信缺失的表现主要集中在学习、经济、社会交往三个方面。在学习方面,大学生诚信缺失主要表现在考试作弊、论文抄袭、不尊重科学事实、臆造科学数据等方面,大学生考试作弊已成为当下大学校园发生频率较高的现象。在经济方面,拖欠助学贷款、恶意透支信用卡、拖欠学费、弄虚作假获取贫困生资格骗取国家助学金等现象时有发生,严重影响了大学生的经济诚信意识。在社会交往方面,存在着提供虚假信息获取求职岗位、求职签约后又随意毁约、网络交友及网络求职提供虚假信息等现象。这些诚信教育的缺失行为不仅冲击了当代大学素质教育的失效,也损害了大学生在社会价值体系中被赋予的较高的知识文化和道德标准的形象。如果在这一阶段诚信教育没有得到应有的提高和深化,那么在大学毕业进入社会以后,这不仅会加剧整个社会诚信体系的退化,也会潜移默化的影响着整个社会诚信的建设。
2博弈论视角的大学生诚信缺失行为分析
2.1诚信与失信的简单博弈分析
博弈论主要是用来解决主体之间的行为发生直接相互作用时候的决策,以及这种决策之间的均衡问题。为研究方便,本文选取了大学生申请助学贷款与银行放款这二者之间在诚信与失信方面的博弈分析,并在分析中做出了以下的假定:①本文只研究两个行为主体之间的诚信与失信的博弈,假定一方为大学生,另一方为银行,假定大学生和银行这两者都是“经济人”,以追求自身利益最大化为目标,并且不能控制对方的决策;②博弈的双方均为“理性人”,具有机会主义的倾向,即在双方博弈过程中,一方发现欺骗可以获利时,就会采取或选择欺骗策略;③博弈双方可以选择的策略为诚信或失信;④博弈双方的获益。采取诚信,大学生和银行双方都可以获益5;如果银行放款,大学生失信不还款,则大学生获益10;如果大学生诚信贷款,而银行失信不放款,则银行获益10;如果大学生选择不贷款,银行选择不放款,即双方均选择失信策略,这样助学贷款制度就失去意义,则双方的获益均为0。在上面的博弈矩阵表可以看出,表中策略组D为纳什均衡解,即大学生、银行双方都以自身利益为选择目标,其最终的选择结果有很大可能是“失信”,因为“失信”是能实现个体利益最大化的最优策略。之所以会出现这种结局,是基于信息不对称的角度双方博弈的结果,如果大学生选择贷款但是不还款,那么学生得到的效用最大,即得到了免费完成学习的机会成本,而银行损失最大,失去了放贷本金和利益以及可以投资在其他领域的沉没成本;而银行如果存在比给学生放款更有收益的项目,那么银行会选择不放款而转向其他,这样银行可以获取自身经济利益的最大化,学生损失最大,不能贷款助学,失去了完成学业的机会。但以上两种策略的选择都不是博弈的均衡点,必然无法达到稳定。实际上只有在学生不贷款,银行不放款的时候,即达到失信的纳什均衡,这样一来大学生助学贷款制度将毫无意义可言,如果这项制度取消了,最后损失最大的还是大学生。然而,经济博弈理论告诉我们,在非价格因素和博弈双方信息不对称的情况下,个体理选择的结果,往往是非理性的。上述例子说明,由于双方的理,导致了诚信的缺失和社会资源的浪费。
2.2诚信与失信的重复博弈分析
重复博弈是一种特殊的博弈,在博弈中,相同结构的博弈可以重复多次,甚至无限次。当博弈只进行一次时,每个参与人都只关心一次性的获益;如果博弈是重复多次的,参与人可能会为了长远利益而牺牲眼前利益,从而选择不同的均衡策略。因此,重复博弈的次数会影响博弈均衡的结果。在上述的分析中,之所以会出现这种失信的“囚徒困境”局面,最根本的原因在于双方所进行的是一次性的简单博弈,即大家所说的“一锤子买卖”。学生和银行双方都无法根据这一次的博弈结果再组织一次博弈、再做一次选择,基于此,博弈双方都只关心一次性的效益。但从动态博弈的过程来看,如果这种博弈是重复的、持续进行的,那么博弈的结果就会发生根本性的改变,诚信策略的纳什均衡就会成为双方博弈的必然结果。因为在动态博弈中,参与博弈的主体过去的行为都是可以看到或者查询到的,因此博弈中的一方可以通过这阶段博弈的选择,来回应博弈中另一方在上一阶段博弈中的失信行为。在诚信的动态博弈中,如果银行在上一次助学贷款的博弈选择中因采取放款的诚信策略,而大学生选择拖欠还款甚至不还款使银行利益收到损失,那么在本次的博弈过程中,银行必然会选择失信的策略来“报复”失信的大学生,比如将他(她)列为银行系统征信的黑名单,那么他(她)将面临银行以后所有的“报复”。在这里,银行所采取的策略被称为“以牙还牙”策略。基于此,为了更加长期、稳定获取各自的效用,博弈双方都会理性选择自己的行为,双方都会选择诚信,于是必然会出现诚信纳什均衡的博弈结果,由此可见,要想使诚信成为博弈双方的主动选择,其关键是要把一次性的简单博弈转化为重复博弈,从而达到双方共赢的目的。
3以重复博弈促进大学生诚信教育的探索
3.1增加博弈双方信息的对称性,将一次性的简单博弈有效转化为重复博弈。
现实生活中,由于信息的不对称、理性人的机会主义、利己主义等行为,因此博弈双方在博弈过程中出现失信的现象是在所难免的。在一次性的简单博弈中,由于博弈双方都无法根据这一次的博弈结果再进行一次博弈或再做一次选择,因此,博弈双方都只关心一次性的效用,那么选择失信策略是理性人的最佳选择。要想克服这种困境,必须将一次性的简单博弈转化为重复博弈。而将一次性的简单博弈转化为重复博弈的主要思路是要加强大学生诚信教育的认知,深刻认识重复博弈与诚信之间的关系。诚信是大学生应有的基本道德素养,但现实是接受过多年素质教育的大学生对诚信内涵的认知还是很模糊,很多人认为诚信已过时,加之受社会多元化思想的冲击,直接导致其诚信缺失行为的出现。其实主体间诚信关系的建立并非一蹴而就,这需要一个长期的选择、磨合、认同的过程,诚信是双方博弈的试金石,诚信关系的确立是双边的、动态的,任何一方的失信都可能导致诚信关系的中断。所以在大学生的诚信教育中,必定要将一次性的简单博弈转化为重复博弈,不能只顾眼前失信利益而忽视长期诚信利益。
3.2建立大学生诚信档案,畅通大学生诚信信息获取的渠道。
大学生诚信档案是一种写实的记录,主要用于对大学生在校期间的诚信情况进行真实描述,同时这种诚信的描述会起到一种客观评定的作用;同时大学生诚信档案也是一种特殊的教育,这种教育会及时发现问题,正视问题,纠正问题,对失信行为有一定的鞭策作用。学校应该将大学生的诚信档案纳入常态化管理,及时公布诚信档案,特别是面向社会公开,畅通社会获取大学生在校期间的诚信档案信息,如果诚信档案不公开,大学生诚信档案信息不能及时获知,这对于失信之人不能起到监督的作用,诚信之人不能起到标杆作用,“囚徒困境”的一次性简单博弈失信策略必然再抬头,那么制定大学生诚信档案也就失去了其应有的作用,所以大学生诚信信息应当及时公开,特别是要面向就业部门公开,并将考试作弊、学术不端、拖欠贷款等诚信缺失行为直接与就业联系起来,对有失信行为的学生暂缓或不予推荐就业,增加失信的一次性博弈成本,让失信之人无处遁形。3.3加大对诚信缺失行为的处罚力度,增加对失信行为处罚的可信性。在多元价值取向下,诚信如果被仅仅当成一种道德规范,很难要求所有人都遵守。在诚信的动态博弈中,若诚信收益与处罚机制不对称时,双方在博弈时基于个人利益必定会选择失信。在经济社会发达的当下,一个可信的处罚威胁是减少诚信缺失最有力的武器,从某种程度上而言,大学生之所以会出现诚信缺失的行为,有很大部分原因是由于高校对大学生失信行为的处罚力度还不够,因此,高校在大学生的诚信教育方面应加大对失信行为的处罚力度,比如针对考试作弊,给予取消考试成绩、记过、甚至取消学位等处分,让大学生意识到失信行为所付出的的巨大代价,并且这种代价要大于通过不诚信行为所获得的一次性博弈的收益。当成本大于收益时,博弈双方基于理性的角度,必定会选择诚信。
4结论
论文关键词:会计信息失真,博弈
会计信息是为信息使用者提供相关决策服务的,会计信息的真实性是保证信息使用者作出正确决策的基本保证。而会计信息造假的存在,极大地损害了信息使用者的利益,也扰乱了资本市场
一、博弈论的基本
博弈论是研究决策主体行为在发生直接相互作用时的决策以及决策的均衡问题。当人们的利益存在冲突时,每个人所获得的利益不仅取决于自己所采取的行动,还有赖于其他人采取的行动,因此,每个人都需要针对对方的行为选择作出对自己最有利的反应。一个完整的博弈模型包括局中人、行动、信息、策略、
(一)会计行为博弈的假设1.假定政府、投资者和其他利益
2.博弈的双方对信息的了解程度是不对称的?乙方是企业的经营者毕业论文格式,对企业的经营情况有充分透彻的了解,甲方作为外部
3.假设会计行为的双方博弈为完全信息静态博弈?静态博弈指博弈中参与人同时选择行动或虽非同时选择行动但后行动者并不知道前行动者采取了什么具体行动;即,在静态博弈中,所有的参与人都是同时行动的, 没有任何人能获得他人行动的信息。
(二)经营者与监管部门之
假设C1(假设为30)为管理当局提供真实信息的收益,C2 (假设为50)为管理当局提供假信息而没被查出的收益,- C3 (假设为-50)为管理当局提供假信息而被查出的收益,C4 (假设为-60)为监管者监管严格的成本,C5(假设为40)为监管者监管不严格的成本?其中C1,C2,C3,C4
单位 监管者
严格
不严格
提供真信息
C1,-C4(30,-60)
C1,-C5(30,-40)
提供假信息
-C3,-C4(-50,-60)
C2,-C5(50,-40)
假设管理当局提供真信息,在此情况下监管者会选择监管不严格,因为C5<C4?当管理当局提供假信息时,监管者也会选择监管不严格?假设当监管者选择监管严格时,管理当局会选择提供真的信息,应为C1>-C3&
(三)投资者与经营
我们假设经理有两种战略选择,且必须选择其中一种。我们把第一种选择称为提供真信息,我们可以认为这是为了保持一个非常健全的内控系统并提供相关可靠的财务报表。第二种战略
表二 经理人员与投资者
投资者 单位
提供真信息
提供假信息
购买
60,40
20,80
拒绝购买
[关键词]网上保险博弈论得益措施
在现代社会经济科技高速发展的大背景下,互联网已融入社会的各个领域当中,给人们的生活与工作带来了极大的便捷。与此同时,人们对网络的依赖也越来越强烈,基于互联网、电话等通信网络的电子商务,正在不知不觉中改变着人们的生活状态和生活方式。作为新型购物方式与时尚生活方式之一的网上购物,也正随着互联网的普及而发展,成为计算机世界中又一重要领域,受到了包括经济学家和社会学家在内的广大学者,以及社会不同群体的关注。
网上保险交易作为网上购物的一种,在这个网络浪潮中也受到了越来越多人们的关注,但与一般的网络购物性质不同,网上保险交易的实质是无形的,实现的是资金的流动。因此它比一般的网络交易具有更大的不可测性与管理难度。下面从博弈论的角度出发,分析网上保险交易发展的利弊。
一、网上保险交易的博弈论分析
考虑到网上保险交易时间上的特性,本人认为相较之于静态博弈,动态博弈更能体现出网上保险交易的特点。因此本文这里选用了一个博弈树的动态博弈结构来分析保险公司开展的网上交易。
在这个博弈中,我们有两个参与方,即经营网上保险业务的保险公司与网上投保人,为了给他们的行为有个合理的解释,我们采用经济学里的经济人的解释。即他们的行为都符合他们自己的利益最大化。另外我们还假设两个参与方的行为具有独立性,即一个参与方的行为与决策是完全独立的,不受另一方的束缚。
在博弈过程中,我们假设博弈参与双方对信息和博弈过程均是了解的,不存在信息不对称的情况,因此这是一个完全且完美信息的动态博弈。
有了以上假设,我们可以开始我们的博弈分析。
保险公司与投保人网上交易博弈的博弈树描绘如下:
在这个博弈树中,顶上第一个白圈表示的是投保人在第一阶段的行为,在这里,投保人作为选择的第一顺序人。可以选择是否通过网上进行保险的交易,如果选择是,则博弈进入第二阶段;如果选择否,则双方的得益为A(0,0),均为0,既没有损失也没有得益。(当然这是一个简化的描述,保险公司的网上开办费与两管理费等成本被省略了)
在第二阶段,黑圈表示保险公司在第二阶段的决策。保险公司接受了投保人的投保,这时他开始作为博弈的主体进行选择,在这阶段,他可以有两种经营方式,一种是有差错的经营方式(这里所指的“差错”既包括保险公司内部经营的种种不规范,也包括保险公司网络外部管理的无力与缺陷),一种是规范的经营方式,即能通过有效监督使得网上保险交易能够顺利进行,投保人的权益能够得到保障。保险公司的两种经营状态将导致B和C两种得益情况的出现。
在得益B(-a,b)中,投保人获得的得益为-a,之所以为负数是因为保险公司的差错经营方式,往往会对投保人造成信息外泄、退保金被人冒领等等的意外损失。而保险公司仍然可以获得投保人缴来的保费b。
在得益C(c,d)中,投保人在保险公司通过规范的经营管理的状态下获得了自己的理想投保得益结果c,而保险公司的经营得益为d。
让我们来对博弈的结果做一个简单分析,很明显,投保人的得益依赖于保险公司的不同经营状态,在投保人能够有效预知得益结果的情况下,他会在保险公司选择差错经营时选择不投保,因为投保会给他带来负得益;而当保险公司规范经营时,投保人会选择投保,达到他购买保险的理想状态。因此在这个博弈的第二阶段,保险公司的经营状态对投保人起到决定作用。但要保险公司选择得益C而不是得益B,则需要保险公司在得益C下的结果d大于得益B下的结果b,这样保险公司才有动力去选择得益C。
但从实际出发分析,我们了解:如果没有有效地对保险公司网上经营情况的监管,而投保人又不能对保险公司的行为做出约束(出自我们的独立性假设),则保险公司的得益C下的结果d往往和得益B下的结果b没有区别。甚至由于规范经营要付出更多的经营成本,很有可能出现得益d要小于b的情况。在这种情况下保险公司出于经济人的思维自然会毫不犹豫选择得益B,而投保人在预见到保险公司在第二阶段选择得益B自己获得负得益的结果后,选择在第一阶段不投保。于是博弈在第一阶段即告结束,网上保险开办失败。
幸运的是,我们博弈可以从两方面进行修正。一是投保人可以对保险公司的行为进行约束,只要放松我们的独立性假设,从而使得单次博弈的结果中第二阶段保险公司的得益C的结果d大于得益B下的结果b(投保人可以通过投诉、联合抵制等手段促成上述的结果),在这样的情况下,保险公司出于经济人的目的自然会选择得益C;二是我们可以进行重复博弈。很明显,重复博弈需要保险公司与投保人之间的长期关系。而刚才的博弈树分析显然是“一次买卖”,保险公司不能奢望投保人参与一个他自己此次吃亏的博弈。而N次重复博弈的得益Nd,则是一个相当巨额的利润,远远大于保险公司通过一次投机所获得的得益b。因此,在预见到N次重复博弈的理想结果下,保险公司有足够的理由去选择在第二阶段的得益C,从而获得投保人的信任与继续支持,让博弈能够一直进行下去。
二、结论
从以上博弈分析我们了解,要发展网上保险业务,至少要从以下三个方面进行努力:
1.加大网上保险业务的宣传。很明显,投保人要在我们的博弈树中第一阶段选择投保,必须是在他知道已经有网上保险业务存在的条件下。因此,要让投保人能够在投保时选择我们的网上保险,前期宣传是必不可少的。在宣传中,我们需要开动脑筋,用能为大众接受和喜闻乐见的方式来宣传网上保险。这方面,我们可以参考网上银行的宣传经验,成立专门的宣传部门,通过宣传人员的不间断、连续的工作。从网上保险的使用到网上保险的优点,真正为客户全面解读网上保险的功用。解除客户的疑惑,消除客户的后顾之忧,让更多的群众能够接受网上保险,理解网上保险。
2.完善网上保险的法律环境。只有具备一个良好的法律环境,我国的网上保险才会取得迅速的发展。有了法律制度框架的保护,投保人才能够放心地选择网上保险进行交易。因此,有关部门应当针对网上保险的特点及风险成因,从我国网上保险发展的全局出发,加快制定相关的法律法规,建立较为系统的网上保险法律体系,通过法律保护网上交易者交易的安全,为我国网上保险的发展提供有力的法律保障。我国的网上保险法律体系,应既包括关于保险资金的流通、网上保险欺诈与犯罪、网上保险监管等公法的内容,又应包括涉及网上保险与客户、网上保险与网络服务商之间权利义务关系的私法内容;应既包括确立网上保险法律关系中各当事人权利义务的实体规范,又包括实施各项权利义务的程序性规范。而且,相关法律法规的制定要具有前瞻性。由于网上保险依托的是计算机网络技术,计算机网络技术的发展速度非常迅猛,而各种法律法规为维护其权威性,不能频繁地进行变动、更新,都具有稳定性的特点。因此,在制定相关的法律法规时,要将眼光放长、放远,要在充分考虑计算机网络技术发展趋势的基础上进行。
3.加强对网上保险的监管。监管部门应根据有关的法律法规对网上保险进行有效的监管,这对于网上保险业务的发展能起到较好的规范作用,能够确保网上保险业务有序、健康的发展。但很明显,只依靠上层监管的单方面监管是远远不够的,针对网上保险风险的复杂性和从我们上面的分析可知,网上保险业务的监管体系应是一个由上层管理者、保险公司自身、投保人、专业媒体等多方构成的立体监管结构。市场调查公司或会计咨询公司可以对网上保险的服务进行监管,投保人集团也可以对网上保险的服务质量及价格进行监管,新闻媒体也可以对网上保险遵守执行国家金融法律法规的情况进行监管。只有形成广泛的社会监督,才能提高监管的效率和质量。才能让网上保险的发展,走上一条健康而有序的道路。
参考文献:
[1]张海燕:《网上保险势在必行》.金融理论与实践,2002年第6期
一、非物质文化遗产保护下的合作者
在市场经济高度发展的今天,如何在法律保护仍不健全的情况下,发动社会力量来促成对非物质文化遗产的私力救济,值得研究。笔者对河南省武陟县某非物质文化遗产丰富的乡镇的调研资料整理后发现,当前社会中对非物质文化遗产保护有三种力量:国家、非物质文化遗产传承人以及外力保护人。国家制定相应法律、法规,颁行相应政策,成立相应机构,投入大量财力对非物质文化遗产进行保护;非物质文化遗产传承人广泛演出,广收学徒(但作用、效果有限),以达到传承、保护该非物质文化遗产的目的;外力保护者鼓励、引导传承人进行传承活动,不断发掘处于濒危的非物质文化遗产,为非物质文化遗产保护争取政策、财政支持,同时为国家保护非物质文化遗产建言献策,向国家切实反映非物质文化遗产的实际保护需求,为政策导向提供相关现实依据,外力保护者扮演着沟通国家和传承人的桥梁作用。这三种力量相互作用,在非物质文化遗产保护方面发挥着重要作用。“理论的成效在于理论能够指导实践、解疑释惑、指引未来方向,并转化为广大群众改造客观世界的现实力量。”[1]理论研究的不足可能对实践保护产生消极影响。目前,我国大多数学者对“为什么要保护”的理论研究不足,只停留在“因为要保护,所以要保护”的基础层面,没有给出保护的具体理由,亦没有给出国内外非物质文化遗产保护的专家、学者等外力保护人介入的充分理由。例如,国家作为保护主体之一,其保护义务源于职责使然,自不待言;但非物质文化遗产传承人和外力保护人同处于保护主体行列,不禁令人心生疑问:非物质文化遗产传承人或基于其传承地位(身为传承人,自然不能令其在本代失传)或基于其生计需要(混口饭吃)?但笔者经调查发现:75%①的传承人生活殷实,年收入大约为两万元,其并不靠卖艺为生;某村非物质文化遗产传承人只有5人,平均年龄为75岁,由儿女供养,不用为生活而发愁。②外力保护人大多为高校学者,这与他们的工资或者职称评定关系不大,他们为什么会介入,似乎个人英雄主义还有些道理。[2]显然,一句“因为要保护,所以要保护”根本无法解答上述问题。从博弈理论看,世界上任何两者之间都存在着博弈,任何两者在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。显然,在非物质文化遗产保护的多方合作中,国家、传承人和外力保护人之间存在着相互博弈的关系。通过博弈论,我们可以数学建模的形式,将三方主体之间的合作问题给予清晰的解答,帮助我们在保护非物质文化遗产过程中,协调三方保护者的合作关系,达到保护非物质文化遗产的最佳效果。
二、博弈论下的合作原因分析
(一)博弈论概述
博弈论又被称为对策论,它是现代数学的一个新分支,也是运筹学的一个重要组成内容。《博弈圣经》中将博弈论定义为:“是二人在平等的对局中各自利用对方的策略变换自己的对抗策略,达到取胜的意义。”博弈论研究在相互影响相互作用的环境中主体如何行动,预测博弈者在特定博弈情况中的行动选择,为分析人类行为提供了一套有力的工具。同时,博弈论坚持理论选择的均衡分析思路,“运用理性行动者模型,设定博弈者希望最大化其个人收益”。[3]博弈结果由所有人的行动共同决定,既然每个人都是理性的,会运用他所有的知识和信息追求效用最大化,则他选择行动时就会考虑别人同样为理性的。博弈论的经典案例“囚徒困境”体现了个体理性与集体理性的冲突,理性人追求利益最大化。上文中提到,国家、传承人和外力保护人在非物质文化遗产保护中都以合作者的姿态出现(国家出于责任而合作,传承人出于传承而合作,外力保护人出于学识及研究而合作),他们都基于不同的期望,在平等的对局(指保护的准入)中各自利用对方的策略变换自己的对抗策略以期待达到均衡效果,从而实现自己的期望。可见,国家、传承人和外力保护人围绕对非物质文化遗产的保护原因和互动,可运用博弈论做出恰当的解释。他们之间存在着相互博弈的关系———国家与传承人之间、传承人与外力保护人之间和国家与外力保护人之间的理性博弈。据笔者调查资料显示,影响三者间博弈均衡路径的因素主要有二:一是传承人不合作的预期成本,包括可能受到的财产损失,名气衰落,历史负罪感等;二是保护的可执行性,这又取决于国家的倡导力度,外力保护人(专家、学者、社会团体等)围绕保护非物质文化遗产形成的信息构成以及信息搜索和检验成本等。综上所述,我们可以依据他们在博弈中所扮演的角色和掌握的信息,将博弈分为三种形态:完全信息静态博弈(国家和传承人之间)、完全信息动态博弈和不完全信息动态博弈。
(二)非物质文化遗产保护下的博弈模型
1.完全信息静态博弈
(国家与传承人的博弈)在完全信息条件下,国家与传承人之间的博弈类似于斗鸡博弈。假定两人举起火棍从独木桥两端走向中央火并,各有两种战略:前进或后退。都前进则会两败俱伤;一方进一方退,进者胜退者丢面子;若都退,双方皆丢面子。[4]数字表述见表1。这个博弈有两个纳什均衡:一方进一方退。国家和传承人的博弈与此类似。双方目的明确,国家开发非物质文化遗产为了发扬文化,提高国际影响,传承人为了该技艺被开发而获得财政补贴,两方目的明确。可以假定他们在法律中债权债务关系明确,B(传承人,下同)欠A(国家,下同)100,金额可以协商。若合作,A可以获π=90,减免B债务10,B可获π=10;如果一方强硬一方妥协,则强硬方π=100,而妥协方π=0;如双方强硬,发生暴力冲突,A无法收回债务,损失-100,则A的收益支付是π=-200,B的收益支付π=-100,支付关系如表2所示。A、B各有两种选择策略:合作或不合作;选择自己的最优战略时都假定对方的战略给定:若A合作,则B不合作是最优战略(100>0);若B合作,A不合作将获得较大收益(100>0);于是双方都不合作,企图获得100的收益,却不曾考虑这一行动会给自己和对方带来负效益的100。即国家和传承人为达到利益的最大化,会选择不合作,因而陷入囚徒困境。就上述博弈而言,须外力介入(如引进可协调的推动行为)才有可能改变博弈支付,走出囚徒困境。
2.完全信息动态博弈
在上述博弈中,究竟哪方应合作,需要通过完全信息动态博弈来解决。尽管形式上有两个纳什均衡,但由于当今我国保护机制不佳,故B首先会选择不合作,因此,这是一个动态博弈。A在B选择不合作后,不会再选择不合作,因为收益支付为-200<0,故A只能选择妥协(合作)。上述结论也得到了田野调查相关资料的印证,目前有些地方政府(尤其是非物质文化遗产丰富地区)多次召开专家论证会议,其目的正在于通过这种途径加强与专家、学者的联系,与上述外力保护人合作,达到共同保护的目的。而在双方不合作的情形下,B虽然收益-100<0,但B会预期,他选择不合作时A必然会选择合作,故B的理性战略为不合作。因此,这一博弈的纳什均衡实际上是:B不合作A合作。但在这一博弈中,传承人即便是实力相对弱小,但可选择抵赖,其可视为另一种意义上的不合作。故即使B实力相对弱小,上述纳什均衡仍成立。公权力如需打破上述均衡,须引进第三者:外力保护人(专家或学者,当然还可以引进民间社团,声望绅士)。该条件下外力保护人和传承人的博弈可以如图1所示。设外力保护人(专家、学者等)成本为10,保护成功则在收益中扣除,不成功则自行承担,保护成功后专家或学者的收益是全部收益的40%。外力保护人介入后,传承人可选择合作与不合作。若传承人选择合作,有完全合作和部分合作两种情况,前者外力保护人与传承人收益支付为30,0,后者收益支付为26,10。传承人选择不合作后,外力保护人也有合作与不合作两种选择形态:如双方都不合作,学者无法完成学术研究,非物质文化遗产亦得不到保护,故收益支付为-110,-100;若传承人合作,双方皆耗费成本10,收益支付分别为-10,90;90>-100,-10>-110,说明外力保护人不合作,传承人亦不合作、此后外力保护人的最优战略选择则应当是合作。而与其介入获益-10,还不如不介入。可见,在完全信息条件下,外力保护人难以达到保护和研究的效果,这一点也得到田野调查结果的支持。
3.不完全信息动态博弈
在不完全信息条件下外力保护人与传承人的博弈如图2所示。N为自然,外力保护人可调度资源分为丰富和欠缺两种情况,Χ代表外力保护人可调度资源大小的概率。假定外力保护人介入保护的成本为10,保护成功则在收益中扣除,保护不成功则自行负担,保护成功后外力保护人的收益可设定为40%,传承人不合作需承担成本10。若传承人不合作,外力保护人合作,则收益支付分别为90、-10。本论文中所调查的专家或学者对非物质文化遗产的保护是一个不完全信息动态博弈。保护行动开始阶段,受保护传承人不知道外力保护人的社会可调度资源,外力保护人也不知道传承人的信息。如外力保护人的社会资源可调度力度不及,则双方可能各导致损失-100,因而可能发生非物质文化遗产无法得到及时、有效地保护至使其衰败、没落甚至灭绝。此时,外力保护人,传承人收益支付分别为-110,-100。如果外力保护人的社会资源可调度力度强大,无论如何必定要比传承人付出更多的努力和思考,因为外力保护人作为外来力量,不能“坐吃空山”、有“先入为主”的观念,需付出一定努力方可启动保护行动,故双方都不合作将导致外力保护人损失-5,传承人损失-200。在该博弈中,Χ值可通过如下不等式计算:-200•Χ+90(1-Χ)<10Χ>0.276,即当外力保护人的社会资源可调度力度大于0.276时,传承人的最优办法是选择合作。而外力保护人基本上都是专家、学者或者财力强大的人士,所以其社会资源可调度力度通常会大于0.6>0.276,故传承人为避免更大的损失-200,最优策略选择只能是合作。此时,外力保护人、传承人的收益支付分别为26、10,传承人的收益是通过达成一定意向协议,争取到收益是剩余(90)的40%再扣除成本10,国家收益为(100-10)60%=54。因此,国家发动公权力之外的外力保护力是合适的,也是合算的,大多数情况下达到了保护的目的。但个别情况下,外力保护人不合作,传承人不合作,国家最后放弃,外力保护人、传承人的收益支付分别为-10、90(减少即失败,因没有将手中的资源转化为财产)。至此,从博弈论—纳什均衡理论角度分析国家、传承人和外力保护人的合作关系完毕。
三、非物质文化遗产保护的建议
博弈论清晰地解读了为什么国家、传承人和外力保护人会相互合作,同时致力于保护和传承非物质文化遗产。那么,究竟该如何解决合作问题,笔者在此提出一些可操作性的建议。
(一)传承人的发展
针对传承人在传承非物质文化遗产过程中后继无人,非物质文化遗产面临失传的问题,传承人首先应该对自己所掌握的技艺进行整理和完善,加强自身的储备。其次,对非物质文化遗产进行录音、录影,使非物质文化遗产得以完整保存,不至于某传承人去世后他人再无从知晓该遗产内容。再次,注重非物质文化遗产“生态场”的保护,[5]传承人可自发成立非物质文化遗产传承社团(例如戏曲可成立剧社等)使其处于活态的演绎当中。同时配合外力保护人的采访和帮助,在申报国家项目过程中展现自身的特点。但是,传承人也会遇到自身无法克服的事项:没钱维持该艺术的继续存活;工具破烂不堪,无法使用;外出汇演没有经费,吃住行全都要自己掏腰包;由于自身小农的局限性,传承人没有高度的纪律性;不服领导者安排等。剧社运作逐渐困难,没有成绩,效率很低,且该运作弊端自身无法解决,剧社运作处于恶性循环之中。①这时就需要外力保护人的介入和帮助。
(二)外力保护人与传承人的合作
外力保护人在传承人自身无法解决困难的情况下介入,帮助传承人成立剧社,并与同行进行交流。同时外力保护人利用自己的人脉资源以及其他方法帮助他们申请非物质文化遗产项目,以期得到国家或者财团的资助,使剧社能够良性运行。同时,外力保护人需要意识到,非物质文化遗产是一个乡村文化,它无法离开生它养它的地方存活,应将其置于“适宜的生活场、自由的生存场、给力的艺术场”中才能不断发展[6]。因此,外力保护人应暂时退出运作行列,将该社团组织置于乡村的自治状态之中(虽然乡村自治仍会有很多弊端)。但由于传承人普遍具有的局限性,没有高度的纪律性,不服统一管理,致使该社团组织处于不良的运作状态。这时,外力保护人需再次介入,采取一系列措施,盘活该剧社,使其回到良性运作中。
(三)国家与传承人、外力保护人的合作
一般分关税壁垒和 非关税壁垒两类。关税壁垒,是指进出口商品经过一国关境时,由政府所设置海关向进出口商征收关税所形成的一种贸易障碍。非关税壁垒,是指除关税以外的一切 限制进口措施所形成的贸易障碍,又可分为直接限制和间接限制两类。关税壁垒和非关税壁垒中的直接限制属于传统贸易壁垒的范畴,它们由来已久,而技术性贸易 壁垒是最近几十年出现的新形式,而且越来越多的为发达国家所采用,成为如今国际贸易保护主义的主角。
传统贸易壁垒主要是在商品价格数量上设置障碍,导致出口国商品价格上涨或出口数量变小,其中关税壁垒为其主要代表,本文试以关税壁垒为例进行博弈分析。
假设存在两个国家,A国和B国。当A国对B国某项产品实施关税时,B国也将实施报复,在这场博弈中,两国的信息是对称的。假设两国在采取措施 之前收益各自为M、N;一方采取贸易保护措施,会使另一方损失比例的收益,则A国受保护后的收益为M-M,B国受保护的收益为N-N。如果一方采取 保护措施而另一方未做任何回应,这时双方的利益分配呈现如下情况:如果A国采取保护措施,B国未做回应,则B国收益为N-A国收益方面,由于A国限 制B国产品的进口,国内产业收益增加,设为收益的比例,而国内消费者由于消费了价格更高,质量相对下降的产品而蒙受损失,设为收益的比例。同理,B国 收益中也存在生产商利益的增加和消费者利益的减少两方面影响。其中:M-M
在上述博弈矩阵中,理论上稳定的均衡解是(M,N),此时双方利益均为最优;但是现实中的均衡解是(M-M,N-N),此时双方的利益损 失均为最大。在非合作博弈下,两国制定关税来保护本国产业,但是最终导致两国的利益损失最大,当关税制定成功时,得到最大好处的是两国的生产商,但是消费 者却受到了损失,因为发达国家的消费能力更强,对于国外廉价消费品的依赖性更强烈,所以在制定关税方面,不发达国家有更大的积极性,近几十年来,发达国家 逐渐采用另外一种贸易壁垒方法,那就是技术性贸易壁垒。
关键词:博弈论;语义学;逻辑哲学
贾可·辛提卡是当代著名的逻辑学家,他将博弈论与语义学直接结合起来,创建了博弈论语义学。辛提卡用博弈论的方法来处理命题,就是要确定命题的值,即命题的真或假。同经典逻辑一致,辛提卡预设了命题是二值的。辛提卡首先给出一个定义域D,任何名称都可以在这个集合中找到所指。博弈论语义学的核心是将量词短语看成专名,将句子看成语句函项,然后在给定的定义域D中选择相应的个体将句子中的量词短语替换,从而达到消除量词,找到原子句的目的。在方法上,辛提卡选择了博弈论,他将人们对句子的理解过程比喻为一个两人博弈,两个参与人分别为“我”和“自然”,每个回合必定要分出胜负,不容平局,那么对于一个句子S,根据规则,博弈双方轮流将S约化为S’、S’’,等等,直至最后使得约化的句子不再包含变量和连接词,即原子句,此时双方就可一决输赢。如果这个原子句为真,则我取胜,自然失败;如果这个原子句为假,则自然取胜,我失败。运用博弈论语义学,我们能够从大量的语言信息中得到最基本、最简化的语句,从而能够轻松地判定这些语言信息的真假。理解这一理论的关键是理解定义域D、原子句、博弈等概念。辛提卡的博弈论语义学可以说是维特根斯坦前后期哲学的综合:“语言博弈”概念源于维特根斯坦后期哲学中的语言游戏说,而它的理论核心则是维特根斯坦前期哲学——图象论。
一“图象论”与命题真值
维特根斯坦是学界倍受关注的大师,其前后期思想的迥异恰当地诠释了他的哲学主题:“哲学不是一种学说,而是一种活动。”①有趣的是,辛提卡博弈论语义学所强调的也是动态的理解命题,这与维特根斯坦哲学在本质上殊途同归。
维特根斯坦哲学的主要贡献之一就在于提出了著名的“图象论”。维特根斯坦前期哲学和后期哲学的目的都在于通过研究语言的结构和界限来理解思想的结构和界限。维特根斯坦工作的基点,就是回到逻辑的出发点,即考虑命题的性质。这样,真的界限就构成了语言的界限,维特根斯坦所考虑的就是关于事实的话语。“人给自己造出事实的图象”②。维特根斯坦指出:命题是实在的图象,“图象是实在的一幅模型”③。“图象是一种事实”④。“图象所表现者即是其意义”⑤。“图象的真假在于其意义与实在的符合与否”⑥。维特根斯坦认为,图象与它所图示的事实之间的关系包括两个方面:一是这种关系“由图象元素与物项的配合而成”⑦,这种关系本身也是一种图象;二是“凡图象,不论只有什么型式但要能表象实在———对或错———所必须与实在共有的东西,即是逻辑型式,亦即实在的型式。”⑧所以,“每个图象亦是一逻辑图象”⑨。“对象是简单的”⑩。“对象构成世界的本体。因此不能是复合的。”
一切复合物必然可分解到不可再分的部分,这就是绝对简单的对象,那么,这种绝对简单的对象是什么?很显然,维特根斯坦这一思想的形成深受罗素和弗雷格的影响。罗素对客体进行了区分,一类是亲知的客体,一类是描述的客体,通过“亲知还原”,描述的客体可以转化为亲知的客体,维特根斯坦对罗素的客体进行了扩展,认为属性和关系也是一种客体。语言中的一个名称来表示一个简单的客体,通过这些客体的结合方式,指称客体的名称可以相互组合成句子。对于简单的客体,我们无法定义它们是什么,我们仅仅能够指示它们,这样,我们也就无法言说这些客体是存在的,因为定义一个客体就是意谓着被定义项的存在。维特根斯坦的绝对简单的对象实质上是罗素亲知客体的变体,是经验的客体。图象论的主旨是说明图象如何具有命题的内容,图象可以看成一个句子,一个句子也可以看成图象,这对于解释最简单句子的合理性是显而易见的,那么如何处理复杂的句子呢?
维特根斯坦最开始的设想是用合取和析取处理一切复杂句子,这也是辛提卡采取斯科伦前束式处理量词句的直接思想来源,但是维特根斯坦后来采取了另一个思路,代之以集成的图象法,“凡对于复合体的陈述,都可解析成对于其成分的陈述,解析成一些把复合体完全摹状了的命题。”即一个复杂的表达式的真值取决于组成它的表达式的真值,即命题就是基本命题的真值涵项,这样,维特根斯坦就完成了语言的运作方式。维特根斯坦的这一思想源于罗素和弗雷格的启发,罗素和弗雷格两人都认为命题才是最基本的意义单位,主张将命题形式化,即用数学中的函数表示命题。维特根斯坦对这一思想的运用是水到渠成的。维特根斯坦认为,“命题是原初命题的真值函量”。“原初命题是命题的真值函目”。换句话说,“一切命题都是对原初命题做真值运算的结果”。“命题就是从一切原初命题的总和(自然也从其确是一切原初命题的总和)而得出的一切。所以,从某种意义可以说,一切命题都是原初命题的总括。”
命题与世界的图象论包含了两层含义:一是图象的元素与事物之间具有对应关系;二是图象与事实之间具有相同的逻辑形式。由此,在维特根斯坦看来,“图象是实在的一幅模型”,“图象是一事实”,“图象所表现者即是其意义”。
正是因为命题具有相同的结构,才使得我们可以将其形式化,并且可以进行变项替换。那么,图象如何与世界相联系?在维特根斯坦早期哲学中,这种关系由名称—客体的关系来决定,但是名称如何与客体相联系?与其说维特根斯坦后期哲学是对前期哲学的反叛,不如说是进一步的深入,在维特根斯坦的语言游戏说中,名称与客体的关系被受一定规则支配的人类活动所确定。在完成这个思想转变之后,维特根斯坦不需要图象论了,取而代之的是语言这种被规则所支配的特征。
辛提卡的博弈论语义学是将博弈的方法引入命题分析,他的研究涉及两个问题,第一个问题就是命题的构成和命题的真假,第二个问题就是如何确定命题的真假。第二个是维特根斯坦后期哲学讨论的一个主要问题,其前期哲学为解决辛提卡的第一个问题提供了思想元素。命题是由概念构成的,而博弈语义学中的概念则直接对应维特根斯坦意义上的存在。值得注意的是,维特根斯坦的存在是与事实相对应的存在,是以现实世界为界限的,所以辛提卡用他的可能世界改造了维特根斯坦的客体。在辛提卡看来,很多情况下,人们的语言交流所涉及的客体多是描述的客体,这些描述的客体有些能转换为亲知客体,有些不能,如“结构为H3O的水”,但是人们在日常的交流中又会涉及这些概念,自然在定义域D中也就应该包含这些元素,可以看出,辛提卡的客体是对维特根斯坦客体的扩展。辛提卡的客体分为存在的和可能存在的两类,即在现实世界中存在和在可能世界中存在。而且很明显的是,辛提卡的存在概念不是语义学层面上的,而是语用学层面上的语义,这在博弈论语义学的操作性中得以体现。在辛提卡的博弈论语义学中,定义域D中的个体必须能与可能世界中的对象一一对应,脱离了这种对应关系,我们就不可能知道自己在言说何物,更不用说判定言说语句的真假。正如DanaScott所指出的那样,语义确定一个实现不是必需的,它应该为证实一个实现是正确的提供标准。
在确定了命题的构成之后,需要解决的问题是命题真假的标准是什么。辛提卡认为,命题是有意义的,命题的意义就是命题的真假值。博弈论语义学的处理方法是找到一个体用概念的名称代入量词所约束的变元,即参与人“我”在定义域D中找到相关的个体以证实语句,而参与人“自然”则企图找到范例来证伪语句。那么,如何才是找到相关的个体呢?或者说,怎样才知道代入个体后的语句为真?如前所述,辛提卡在扩展了维特根斯坦概念的基础上明确了命题的构成问题,相应的,辛提卡的命题范围较之维特根斯坦就宽泛的很多。辛提卡将博弈论语义学称为“寻找并找到的”逻辑,寻找并找到了什么?就是找到一个适当个体代入后的原子句所反映出来的图象与现实世界相符合。这不仅直观,而且符合人们的日常交流。可见,在确定命题真假的标准上,辛提卡与维特根斯坦是一致的,就是采用图象论的符合标准。辛提卡自己也曾明确指出,“博弈语义学不排斥图示的(同形的)关系理论,图示的(同形的)关系理论在原子句和现实之间建立了联系。”从这句话我们可以看出,要确定命题的真值,只要将命题与图象做个比较就可以了。用辛提卡的话说就是,“名称-客体关系曾经被建立,仅仅需要一件事,这件事就是将原子句和现实相比较。”
辛提卡指出:“维特根斯坦的图像理论和逻辑语义学之间的相似性和非相似性更有趣。最重要的大范围相似性之一,就是在两个理论中,语言的基本元素和现实的特定方面之间的代表关系,用任何的方式都不能进一步的分析。”罗素指出,事实是意指那种使一个命题真或假的事物。而一个命题的本质就在于:它可以两种方式,即以人们所谓的真的方式或假的方式对应于一个事实。最基本的事实是原子事实,与原子事实相对应的是原子命题,它肯定某物具有某种性质或某些事物具有某种关系。原子命题的真假取决于它是否与原子事实相符合。在原子命题的基础上,借助逻辑联结词就构成了分子命题。分子命题的真假取决于组成它的原子命题的真假,是原子命题的真值函项。在分子命题的基础上,借助逻辑量词可以构成更高一级的概括命题。其真假最终也取决于原子命题的真假。维特根斯坦继承了这一思想,认为任何复杂命题经过分析都可以还原为最基本的原子命题。辛提卡由此得出结论:“一个指示性句子的表达在通常的本质上不是这些语言博弈的一个回合,在这些语言博弈中,给出了几个构成成分的词语,并且因此给出了整个句子的内涵。”在辛提卡的博弈论语义学中,我们根据可能世界理论可以确定定义域D,根据维特根斯坦的图象论可以处理命题,并且将命题的具体处理方法转化为真值函项的求解,那么,接下来要考虑的是,我们究竟应该如何为真值函项求解,并且这个方法是否可以形式化。遵循维特根斯坦的哲学思路,辛提卡找到了博弈论。
二“语言游戏说”与语义博弈
维特根斯坦的“语言游戏”说中的所谓“语言游戏”,实际上是把游戏当成是运用语言的比喻,即强调语言的使用,他指出:“我将把由语言和行动(指与语言交织在一起的那些行动)所组成的整体叫做‘语言游戏’”。维特根斯坦认为,语词的意义在于使用,运用语言是一种活动,我们使用的语词在不同的场合会有不同的意义,必须根据具体的使用环境才能确定语词的意义,试图通过孤立的逻辑分析来揭示语词的意义,结果只能误入歧途。维特根斯坦对语言的这种处理方法,实质上是从具体的语境动态地观察语词的用法,我们不能孤立地去问“什么是意义”这一类的问题,而应该说“什么是意义的解释”。弄清一个语词代表什么之前,必须首先掌握包括这个语词在内的那种语言游戏,一个词语的意义也就是它在语言游戏中的实际用法。维特根斯坦对于语言及其意义问题的思考,得益于一场足球比赛的启发,同时,相较于足球比赛,语言游戏也存在规则,在维特根斯坦看来,遵守规则是语言游戏的灵魂,也是一切人类行为的必要条件。维特根斯坦用了很多篇幅讨论规范和遵守规则。“遵守规则,做报告,下命令,下棋都是习惯(习俗,制度)。
“遵循规则类似于服从命令。人们是被训练这样做的;人们是以特定的方式对命令做出反应的。人类共同的行为方式乃是我们据以解释陌生语言的参考系。”可见,规则和遵循规则是人们在实践和交往中形成的相对稳定的行为准则和行为模式。这种语言游戏所遵循的规则究竟是什么?是否就是逻辑必然性?“维特根斯坦最终在他的认识论斗争中失败了”。
其实只要留意维特根斯坦前期哲学,我们不难发现维特根斯坦在处理这个问题上的缺陷,维特根斯坦指出:“我的根本思想是‘逻辑常量’不代表任何东西。事实的逻辑不可能为任何东西所代表。”“没有‘逻辑的对象’、‘逻辑常量’(照弗雷格与罗素的意义),于此便显然可见。”虽然维特根斯坦不承认逻辑常项的存在,但是认为客体具有逻辑形式,这种形式使得客体能够聚拢。
辛提卡认为维特根斯坦的语言游戏受到博弈论的影响。“游戏概念的主要用法如此多地分享了像冯·诺意曼(vonNeumann)和约翰·纳什(JohnNash)那些数学家构建一个详细的游戏的一般理论的结构,那个理论旨在帮助科学家与哲学家理解有趣的问题的范围。它们甚至包括了真理与意义的问题(以及其他的语言—世界关系)以供讨论,维特根斯坦从中提出了他的语言游戏观念。”
与维特根斯坦相同,辛提卡在确立了命题和世界的图示关系之后,需要研究的就是这种关系是如何建立的,“处于这些描述关系之间的关系是什么?”在辛提卡看来,单纯的图像论已经不能解释这个问题了,图像论的任务是描述关系,那么对关系的关系的刻画,则需要另一个理论。辛提卡指出:比起那些为解释语言与现实结合所需要的思想,维特根斯坦经常包含更多的语言博弈思想。“为了理解(一个给定的一阶逻辑语句)F,我们显然没有足够的时间和记忆空间,事实上,我们对一阶语句的理解必须建立在对语句和世界的有限的逐步比较之上,而不是(潜在的)F的图像本质。”“有时语言博弈能够明显的被发现用于提供词语和它所刻画之间的关联”。
这里我想指出的是,或许我们用图像论处理语句理解的时候已经不足道了,但更为恰当。辛提卡认为自己受到“维特根斯坦有关思想的启发,强调受规则支配的人类活动,亦即寻求和发现语言游戏的重要性。”但是,辛提卡“比维特根斯坦走得远得多,因为后者的思想是轮廓性的且不系统。”“在我没有有效的方式找到我的下一步该如何行动时,我怎么可能在实践中采取一个策略?”
这里有几种选择。也许有人会像在非确定性证据系统内所做的那样提出某种思路,但是辛提卡建议把我的策略限制在递归中。这种限制的方法是非常精致的,它注意到了维特根斯坦对语言游戏中实际可游戏性的思考。辛提卡坚持认为语言目标导向语言本质,这可以帮助我们重新认识处于维特根斯坦形式化时期的游戏概念的意义。当时,维特根斯坦使用“游戏”来指称目标导向的活动,诸如证实或者证伪的活动。辛提卡延用了这一思想,他说:维特根斯坦的“用法”概念强调的是一种活动,是一种构成一个词的自然环境并使该语词从中获得其意义的活动。超级秘书网
博弈论又称为“对策论”,一种使用严谨数学模型来解决现实世界中的利害冲突的理论。由于冲突、合作、竞争等行为是现实世界中常见的现象,因此很多领域都能应用博弈论,例如军事领域、经济领域、政治外交,解决诸如战术攻防、国际纠纷、定价定产、兼并收购、投标拍卖甚至动物进化等问题。
博弈论的研究开始于本世纪,1944年诺依曼和摩根斯坦合著的《博弈论和经济行为》一书的出版标志着博弈理论的初步形成,随后发展壮大为一门综合学科。1994年三位长期致力于博弈论研究实践的学者纳什、海萨尼、塞尔顿共同获得诺贝尔经济学奖,使博弈论在经济领域中的地位和作用得到权威性的肯定。
2.博弈论的基本原理和方法
文献[1][2]用浅白的语言叙述了博弈论的思想精髓和基本概念。文献[3][4]更注重理论上的分析和数学的严谨。概括起来,博弈论模型可以用五个方面来描述
G={P,A,S,I,U}
P:为局中人,博弈的参与者,也称为“博弈方”,局中人是能够独立决策,独立承担责任的个人或组织,局中人以最终实现自身利益最大化为目标。
A:为各局中人的所有可能的策略或行动的集合。根据该集合是否有限还是无限,可分为有限博弈和无限博弈,后者表现为连续对策,重复博弈和微分对策等。
S:博弈的进程,也是博弈进行的次序。局中人同时行动的一次性决策的博弈,成为静态博弈,如齐威王和田忌赛马;局中人行动有先后次序,称为动态博弈,如下棋。
I:博弈信息,能够影响最后博弈结局的所有局中人的情报,如效用函数,响应函数,策略空间等。打仗强调“知己知彼,百战不殆”,可见信息在博弈中占重要的地位,博弈的赢得很大程度依赖于信息的准确度与多寡。得益信息是博弈中的重要信息,如果博弈各方对各种局势下所有局中人的得益状况完全清楚,称之为完全信息博弈(gamewithcompleteinformation),例如齐威王和田忌赛马,各种马的组合对阵的结果双方都不严而喻。反之为不完全信息博弈(gamewithincompleteinformation),例如投标拍卖,博弈各方均不清楚对方的估价。在动态博弈中还有一类信息:轮到行动的博弈方是否完全了解此前对方的行动。如果完全了解则称之为“具有完美信息”的博弈(gamewithperfectinformation),例如下棋,双方都清楚对方下过的着数。反之称为“不完美信息的动态博弈”(gamewithimperfectinformation)。由于信息不完美,博弈的结果只能是概率期望,而不能象完美信息博弈那样有确定的结果。
U:为局中人获得利益,也是博弈各方追求的最终目标。根据各方得益的不同情况,分为零和博弈和变和博弈。零和博弈中各方利益之间是完全对立的。变和博弈有可能存在合作关系,争取双赢的局面。
还有另一类型博弈称为多人合作博弈,例如安理会投票表决,OPEC联合限产保价等问题。这类问题重点放在联盟利益的分配上,它的理论和方法广泛应用于利益损失的共同分担问题。多人合作博弈的研究方法主要是特征函数模型。以个可能的联盟为定义域,特征函数表示各个联盟的得益(N是局中人的数目),它的分配解必须符合一定的合理性和稳定性,它的解的概念也发展成多种多样,包括稳定集、核心、核仁、Shapely值等。解的多样性符合现实世界复杂多样的需要,针对不同的问题选择或创造合适的解的概念是博弈论深入研究的课题。
不管博弈各方是合作、竞争、威胁还是暂时让步,博弈论模型的求解目标就是使自身最终的利益最大化,这种解建立在对方也采取各自“最好策略”为前提,各方最终达到一个力量均衡,也就是说谁也无法通过偏离均衡点而获得更多的利益。这就是博弈论求解的本质思想。
3、博弈论与电力市场
博弈论是研究市场经济的重要工具。电力作为特殊的商品,它的生产、运输、销售和消费也逐渐走向市场化。世界范围内很多国家的电力工业走向放松管制、引进竞争的进程中,遇到很多前所未有的新课题,运用博弈论来分析解决其中一些问题是一个研究方向。用博弈论模拟电力市场,模拟的结果可能更加接近实际,为市场模式设计提供依据。另外,电厂或用电用户作为市场的参与者,可以用博弈论来分析市场,研究如何报价获利最大。
正确运用博弈论关键要针对电力市场的特点正确选择模型和解的概念。例如:力量相当的两个区域电网之间交换功率的情形比较适合用古诺模型和Nash谈判解方法;而自备电厂与公用电网之间的交易可能更适合用Stackleberg模型。还有局中人结盟问题:如何识别合作伙伴,结盟利益如何在联盟内分配。电力市场环境下,电网输电作为一项服务,它的网损、固定资产投资如何在网络使用者之间分担。这些分配问题有不同的概念的解:稳定集,核心,核仁,Shapely值等,如何合理选择或创造最接近实际的解的概念也是面临的课题。
博弈的结果是依赖于拥有的信息,采用什么样的信息披露政策是设计电力市场模式的一个方面。例如:电厂竞价上网,一个成功的报价不仅取决于自己的实力,还有赖于他人如何报价。但是各方往往不清楚互相之间成本、报价等信息,因为这些信息都是各自的商业秘密。如何处理这种信息既不完全也不完美的博弈是一个重要的课题。反过来,博弈的实验结果也为电力市场披露怎样的信息提供依据。
博弈论和电力市场理论都是很年轻的科学,两者都有广阔的发展天地,两者的结合可以互相促进。
4、博弈论在电力市场中的应用
4.1自备电厂与公用电网之间的交易
开放发电市场的进程中,拥有自备电厂的用户是一类特殊的市场参与者,它既是用电用户,也可以是电力的供应者。随着电力市场深入发展和工业的进步,自备电厂将成长为一支生力军。
文献[5]用博弈论来分析评价在分时定价的环境下拥有自备电厂的用户(NCP)对定价的影响作用。NCP既可以从公用电网购电,也可以自己发电来满足自身需求。为解决两者的冲突,作者提出了三种博弈模型:非合作Nash博弈模型,合作博弈模型和超博弈模型。作者构造了三个局中人:公用电网,普通用户,带自备电厂的用户(NCP),并且假设它们的需求函数、边际成本、收益函数等均是线性的,通过数字模拟得出了一些有趣的结果:①NCP的加入促使公用电网降低出售给NCP的电价;②冲突还使普通用户得到更多益处。该文为解决自备电厂与公用电网的相互作用提供了很有用的分析思想。但是尚有三点可以进一步改进:①该文尚未考虑NCP将自己多余的自发电卖给公用电网的情况;②该文将公用电网和NCP置于平等的市场地位可能不符合实际市场,如果公用电网规模很大,NCP数目很多但规模小,考虑Stackerlberg模型更符合两者实际;③该文假设公用电网的目标函数是整个社会利益最大化,而并非是自身利益最大化,这个假设不符合电力市场需要解除管制的发展方向。
文献[6]部分解决了以上问题,它重点放在自备电厂和公用电网相互作用的方式的选择:公用电网回购NCP多余电力(buy-backsystem)或者公用电网收取NCP运转电力的过网费(wheelingcharges)。该文分析了在不同市场环境下,各方的得益情况,得出了一些可能只有用博弈论才能得出的结论。
4.2区域间输电交易分析
互联网间短期电力交换是一种经济运行的手段。白晓民等在文献[7]中应用Nash博弈论来分析简单的两区域系统单时段交易分析,得出双方都可接受的交换功率和交易价格。在此基础上,文献[8]提出了一种两阶段迭代计算方法来处理外部交易计划与内部经济调度的协调。该文所用的博弈模型是二人非零和对策,采取合作型对策,应用Nash谈判公理作为仲裁程序,决策出双方都可接受的交换功率和交易价格。应该指出,白晓民等的分析是基于完全信息的博弈也即博弈双方均对对方在各种情况下的得益了解非常清楚。如果缺少这方面的信息,又应该如何分析处理呢?这个问题值得进一步深入探究。
4.3转运市场中电网的固定成本分摊问题
运转市场中一个难题是网络输电服务定价,这个定价能够给网络使用者一个信号,以达到全网最优化;并且能够补偿网络的投资者,网损、变动成本、固定成本等费用在网络使用者中合理分摊;同时能够正确激励网络增容。节点实时价格(nodalspotprice)制度可以解决网损和网络阻塞问题。但是文献[9]的作者认为节点实时价格制度不能完全回收输电系统的固定投资,为了解决双边贸易中输电系统固定成本公正分摊问题,作者提出了基于多人合作博弈模型,可以计算出逐条线路逐笔交易的分摊费用。文中使用“核仁”作为模型的解。该方法的优点:①使用“核仁”而不用Shapely值,因为“核仁”处于核心,分配值更加稳定和易于被各方接受;②提供了一种激励,减轻线路过载。
4.4基于Pool或PX模式的多边贸易市场
电力市场环境下的博弈具有行动策略随机性、信息隐蔽性,这些特点都给建模和计算造成困难,从而限制了实际应用。各种文献在处理这种不确定信息环境下的决策问题中,通常需要假设或者估计对方的信息,方法各有特色。
在文献[10]作者认为在完全竞争的市场环境下,市场参与者相对于市场规模都显得很小,市场影响力很小。在这种情况下,优化报价决策不需要博弈的思想。文中作者认为电力市场属于不完全竞争市场,单个市场参与者对市场是有影响力的,其模型本质上属于不完全信息的非合作博弈。例如:每个参与者只知道自己的成本信息,而不知道对方的成本等信息。在这种情况下作者提出了这样的一个问题:在无法完全了解对方的信息情况下,参与者如何投标(选择高价投标还是低价投标)才能使自己收益最大。该文通过转化的方式把不完全信息的博弈变为信息完全但不完美的动态博弈来求解。每个市场参与者均对自己的对手可能的出价进行分类,并对每一类的可能性进行概率估计,形成一个概率意义上的期望收益矩阵,用Nash平衡点的概念求解矩阵,得到问题的解。
文献[11][12]作者提出了一种谈判模型。每一个局中人进行决策时,都同时执行以下两个步骤:①对可能的合作对象按照一定的指标进行优先排序;②按照谈判优先顺序,逐一进行讨价还价,谈判的规则与程序是预先设定好的。该文的特色是谈判对象的优先顺序表的形成。排序的准则基于该局中人A对关于他人的信息的了解程度。先分别对其他局中人的成本信息进行分类,并对每一类出现的可能性进行概率估计。然后假设与某局中人B进行合作,互相交换共享所拥有的信息,联合成博弈的一方,剩下的局中人结合为博弈的另一方。这样的博弈模型的Nash平衡点是概率意义上的期望值,作为与B合作的优先指标。对每个局中人都进行一遍以上计算,得到了A的谈判对象优先顺序表。每个局中人都有自己的一张优先顺序表。最后按照预先设定的谈判规则与程序,各方同时进行合作谈判,谈判要解决如何合理分配或均衡比单干多出的利益。
该文关键的一点:正确掌握对方的成本、策略等信息。各方可能从每一次博弈的结果中得到有用的反馈信息,并用这种反馈来更新自己的知识库,提高对他人了认识。遗憾的是作者并没有提到如何实现这样重要的学习过程。该文的模拟算法中的一个缺点:计算量随局中人的数目和每个局中人类型的数目的增长呈指数增长。
对于多边贸易模式的电力市场,文献[13]提出了多理论模型,解决贸易合作问题,文中的模型基于完全信息的博弈模型。模拟的过程包括四个阶段:①确定自身成本等信息;②与对方互相交换信息,互相寻求合作伙伴;③按照预先设定的准则和协议进行联合分组,形成一个谈判对象优先顺序表,这个顺序表获得方法于[11][12]的方法不一样。作者采用公平性合作标准和Shapely值来确定这个顺序表;④按照优先顺序表进行双边谈判。作者认为这四个阶段可以反复迭代进行,直至没有人愿意改变合作格局为止或者达到预先设定的计算时间。作者在文中考虑了多种情况,但是模型仍偏于简单。
4.5用博弈论解释和实现算法
文献[14]用博弈论来解释拉格朗日松弛法法解决机组经济组合的算法。该文认为在电力市场的环境下,竞争各方均以实现自身利益最大化为目标,旋转备用的约束变得软起来,PX(powerexchange)机构可能通过松弛这一约束进一步降低成本。该文提出了一种基于博弈论的算法获取最优的旋转备用。
作者认为拉格朗日松弛法的拉格朗日乘子是有经济含义的,松弛旋转备用的乘子被看作是提供备用的价格信息,各时段的旋转备用根据这个信息不断在规定的高低两种备用水平之间调整(例如:为t时段负荷)。根据优化原理,如果拉格朗日函数存在鞍点,则鞍点是原问题的最优解。
鞍点的概念与博弈论中的Nash平衡点有非常相似之处,如以上公式所示。基于此想法,作者构造了两厂商博弈模型。其中一局中人P代表整个实际电网的利益,它控制的决策变量是p,u(p向量表示各机组分配的有功,u向量表示机组启停),目标是使整个系统成本最低。另一个局中人Q,是一个假想的发电商,它以价格向P销售备用容量和有功容量。双方就旋转备用交易进行讨价还价,最终达到一个平衡的交易量和交易价格。作者证明以上博弈过程的Nash平衡解就是拉格朗日函数的解。基于以上结论,作者设计了自适应的次梯度算法寻求平衡点,其中一个关键技术作者设计了厂商P对厂商Q备用容量报价的反应函数该函数将映射到备用容量的两种水平之间(例如:5%Dt-%Dt,Dtt时段负荷),形成一个随价格信息变动的备用容量。根据厂商Q是否了解厂商P的反应函数,模型可细分为两种:Nash模型(不了解对方反应函数)和Stackelberg模型(Q了解P的反应函数),作者认为后一种模型掌握的信息较多,因此收敛的速度和优化的效果梢好于前一种模型。
用博弈论来解释并且设计一些算法是一个新鲜而具有挑战性的课题。博弈论本身就是带有优化功能的一门严谨的数学,不过它更具有人的逻辑思维的色彩,融合了一些用别的方法难以表达的信息。