时间:2023-03-29 09:25:03
序论:在您撰写容错技术论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
当系统内部有故障存在时,通过容错技术消除故障的影响,使系统最终仍能给出正确的结果。按照时间划分,故障可分为以下三种:永久性故障、间歇性故障和偶然性故障。永久故障是永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异。对软件来说,这类故障也就是一个不可以自动恢复的错误状态。间歇性故障是短暂的,但却是断续的,它既有偶然性,又有不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。偶然性故障出现是短暂的,且可能是非重复性的。常常由于环境的变换、电源方面的干扰、元器件性能的波动、软件的随机变换、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。
针对不同故障应采取不同的容错方法。容错技术能自动适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的对策略。按照系统的失效响应阶段,可以把各种容错技术分成三种:故障检查、静态冗余、动态冗余。故障检测并不提供对故障的容忍,而是发生故障时给出一个警告。故障检测广泛应用于微型机和小型机之类的小系统中,其中一些已体现了简单的联机检测机理。严格地说,故障检测不是容错,它尽管检测了故障,但是不能容忍这些故障,不给出故障警告。动态冗余用于纠错码存储器或具有固定配置(即线路器件之间的逻辑连接保持不变)的多数表决冗余计算机之类的系统中。
根据不同情况,一个容错系统可经历以下阶段:(1)故障检测:大多数失效最终导致产生逻辑故障。有许多方法可用来检测逻辑故障,如奇偶校验、一致性校验和协议违章都可以用来检测故障。故障检测技术有两个主要的类别,即脱机检测和联机检测,在脱机检测情况下,进行检测时设备不能进行有用的工作;联机检测提供了实时检测能力,因为联机检测与有用的工作同时执行。联机检测技术包括奇偶校验和冗余校验;(2)故障限制:当故障出现时,希望限制其影响范围。故障限制是把故障效应的传播限制到一个区域内,从而防止污染其他区域;(3)故障屏蔽:故障屏蔽技术把失效效应掩盖了起来,从某种意义上说,是冗余信息战胜了错误信息,多数表决冗余设计就属于故障屏蔽;(4)重试:在许多场合,对一个操作系统的第二次试验可能是成功的,对不引起物理破坏的瞬间故障尤其如此;(5)诊断:对故障检测技术没有提供有关故障位置、性质的信息进行诊断;(6)重组:当检测出一个故障并判明是永久性故障时,重组系统的器件替换失效的器件或把失效的器件与系统的其他部分隔离开来,也可使用冗余系统,确保系统能力不降低;(7)恢复:经检测和重组后,必须消除错误效应。通常,系统会回到故障检测前处理过程的某一点,并从这一点重新开始操作。这种恢复形式通常要后备文件、校验点和应用记录方法;(8)重启动:如果一个错误破坏的信息太多,或者系统没有设计恢复功能,那么恢复就不可能实现。仅当系统未受任何破坏时,才能进行“热”重启,并从故障检测点恢复所有的操作。“热”重启相当于系统需要完全重新加载;(9)修复:即把诊断为故障的器件还原下来,修复也可以是联机进行的或者脱机进行的;(10)重构:对元件进行物理替换之后,把修复的模块重新加入到该系统中去。对联机修复来说,实现重构不中断系统的工作。
随着计算机硬件和网路的快速发展,容错计算机的系统开销逐渐降低,且纠错速度快。而软件方法实现的容错,对硬件不会提过高的要求。同时系统灵活,资源利用比较合理。更正检测、诊断将会采取人工智能的处理途径,以专家系统的各种智能工具来支持故障检测和诊断。利用专家的知识,借助推理机构,迅速而准确地提供诊断结果。系统的动态重构、故障恢复功能及神经元芯片等将被用到容错技术中来,都将在智能化的支持下得以实现。同时对电路内部的自检、自重构研究,可以解决电路本身及子系统的可靠性问题,将会出现容错的VLS1芯片及可直接支持系统容错设计的可容错设计芯片,为系统设计者提供一个具有透明性的容错设计元器件。进入到芯片内部的容错技术的研究将成为容错研究的一大分支。
随着网路时代的到来,对于一个成功的电子商务系统来说,必须响应在线客户的需求并遵守服务的那个协议(SLA),同时保护客户的隐私及电子商务系统安全正常运营。对于客户要求的响应程度及安全保护措施是一个基于Internet的电子商务系统成功的必要条件,容错服务器就成为网络时代电子商务运营商首要选择。未来的智能化家庭都将拥有一个家庭数据中心,可提供全天候的服务,包括家庭安全、防盗和防煤气泄漏以及各种家用电器的控制,这个家庭数据中心也只有采用容错计算机才能担当。今后容错技术将同时在软件和硬件上得到发展,将会出现初级的容错软件的设计方法,应用软件方面的容错设计将会产生一些实用的工具,同时产生一个通用操作系统和硬件相结合的容错方法,走软硬结合的道路。系统容错设计将在分布式系统、CSCW等方面出现新的容错设计方法。
[摘要]随着计算机技术的发展,容错技术和容错计算机将成为新的研究发展方向。本文介绍了容错技术的基本原理及内容,介绍了容错系统的经历阶段和实现容错功能的关键技术,总结了计算机容错技术的现阶段的应用情况。
[关键词]容错技术可靠性容错功能
参考文献:
[1]胡谋.计算机容错技术[M].北京:中国铁道出版社.
[2]杨孝宗.容错计算技术的提出和发展[J].电子和信息化.
当系统内部有故障存在时,通过容错技术消除故障的影响,使系统最终仍能给出正确的结果。按照时间划分,故障可分为以下三种:永久性故障、间歇性故障和偶然性故障。永久故障是永远持续下去直至修复为止的故障。对硬件来说,永久性故障意味着不可逆的物理变异。对软件来说,这类故障也就是一个不可以自动恢复的错误状态。间歇性故障是短暂的,但却是断续的,它既有偶然性,又有不定期的重复性。如一个处于临界状态的电路输出时好时坏,而一个虚焊点就会引起这样的故障。偶然性故障出现是短暂的,且可能是非重复性的。常常由于环境的变换、电源方面的干扰、元器件性能的波动、软件的随机变换、电磁干扰等因素而引起。这样的故障有可能仅出现一次,或很长时间出现一次,但却可能造成数据错误,甚至系统瘫痪。
针对不同故障应采取不同的容错方法。容错技术能自动适时地检测并诊断出系统的故障,然后采取对故障的控制或处理的对策略。按照系统的失效响应阶段,可以把各种容错技术分成三种:故障检查、静态冗余、动态冗余。故障检测并不提供对故障的容忍,而是发生故障时给出一个警告。故障检测广泛应用于微型机和小型机之类的小系统中,其中一些已体现了简单的联机检测机理。严格地说,故障检测不是容错,它尽管检测了故障,但是不能容忍这些故障,不给出故障警告。动态冗余用于纠错码存储器或具有固定配置(即线路器件之间的逻辑连接保持不变)的多数表决冗余计算机之类的系统中。
根据不同情况,一个容错系统可经历以下阶段:(1)故障检测:大多数失效最终导致产生逻辑故障。有许多方法可用来检测逻辑故障,如奇偶校验、一致性校验和协议违章都可以用来检测故障。故障检测技术有两个主要的类别,即脱机检测和联机检测,在脱机检测情况下,进行检测时设备不能进行有用的工作;联机检测提供了实时检测能力,因为联机检测与有用的工作同时执行。联机检测技术包括奇偶校验和冗余校验;(2)故障限制:当故障出现时,希望限制其影响范围。故障限制是把故障效应的传播限制到一个区域内,从而防止污染其他区域;(3)故障屏蔽:故障屏蔽技术把失效效应掩盖了起来,从某种意义上说,是冗余信息战胜了错误信息,多数表决冗余设计就属于故障屏蔽;(4)重试:在许多场合,对一个操作系统的第二次试验可能是成功的,对不引起物理破坏的瞬间故障尤其如此;(5)诊断:对故障检测技术没有提供有关故障位置、性质的信息进行诊断;(6)重组:当检测出一个故障并判明是永久性故障时,重组系统的器件替换失效的器件或把失效的器件与系统的其他部分隔离开来,也可使用冗余系统,确保系统能力不降低;(7)恢复:经检测和重组后,必须消除错误效应。通常,系统会回到故障检测前处理过程的某一点,并从这一点重新开始操作。这种恢复形式通常要后备文件、校验点和应用记录方法;(8)重启动:如果一个错误破坏的信息太多,或者系统没有设计恢复功能,那么恢复就不可能实现。仅当系统未受任何破坏时,才能进行“热”重启,并从故障检测点恢复所有的操作。“热”重启相当于系统需要完全重新加载;(9)修复:即把诊断为故障的器件还原下来,修复也可以是联机进行的或者脱机进行的;(10)重构:对元件进行物理替换之后,把修复的模块重新加入到该系统中去。对联机修复来说,实现重构不中断系统的工作。
随着计算机硬件和网路的快速发展,容错计算机的系统开销逐渐降低,且纠错速度快。而软件方法实现的容错,对硬件不会提过高的要求。同时系统灵活,资源利用比较合理。更正检测、诊断将会采取人工智能的处理途径,以专家系统的各种智能工具来支持故障检测和诊断。利用专家的知识,借助推理机构,迅速而准确地提供诊断结果。系统的动态重构、故障恢复功能及神经元芯片等将被用到容错技术中来,都将在智能化的支持下得以实现。同时对电路内部的自检、自重构研究,可以解决电路本身及子系统的可靠性问题,将会出现容错的VLS1芯片及可直接支持系统容错设计的可容错设计芯片,为系统设计者提供一个具有透明性的容错设计元器件。进入到芯片内部的容错技术的研究将成为容错研究的一大分支。
随着网路时代的到来,对于一个成功的电子商务系统来说,必须响应在线客户的需求并遵守服务的那个协议(SLA),同时保护客户的隐私及电子商务系统安全正常运营。对于客户要求的响应程度及安全保护措施是一个基于Internet的电子商务系统成功的必要条件,容错服务器就成为网络时代电子商务运营商首要选择。未来的智能化家庭都将拥有一个家庭数据中心,可提供全天候的服务,包括家庭安全、防盗和防煤气泄漏以及各种家用电器的控制,这个家庭数据中心也只有采用容错计算机才能担当。今后容错技术将同时在软件和硬件上得到发展,将会出现初级的容错软件的设计方法,应用软件方面的容错设计将会产生一些实用的工具,同时产生一个通用操作系统和硬件相结合的容错方法,走软硬结合的道路。系统容错设计将在分布式系统、CSCW等方面出现新的容错设计方法。
[摘要]随着计算机技术的发展,容错技术和容错计算机将成为新的研究发展方向。本文介绍了容错技术的基本原理及内容,介绍了容错系统的经历阶段和实现容错功能的关键技术,总结了计算机容错技术的现阶段的应用情况。
[关键词]容错技术可靠性容错功能
参考文献:
[1]胡谋.计算机容错技术[M].北京:中国铁道出版社.
[2]杨孝宗.容错计算技术的提出和发展[J].电子和信息化.
关键词:3G视频通信H.264/AVC容错技术
传统的视频编码标准都是围绕比特流的概念组织的。实际上用于传送数字视频的大多数网络体系结构并不适合直接传输比特流。在许多网络体系结构中,比特流需要拆分为数据分组。这些分组的特性,如最小/最大尺寸、相关开销和差错属性等在网络体系结构间、甚至在某个给定的网络体系结构内也是很不相同的。假如视频编码器自身能和网络特性很好的匹配,将能够获得更好的视频QoS。问题是如何容错地支持易差错的无线移动网络?为了解决无线移动信道视频的容错传输,我们将采用如前向纠错编码及支持差错复原的视频压缩编码技术来解决。H.264编解码器可以很好的解决易差错信道的视频容错传输。在3GPP/3GPP2的传输环境下通过选择适当的条带长度使H.264编解码器和无线移动信道的网络特性得到很好的匹配,实现无线移动信道视频的容错传输。H.264标准适用于无线网络传输的主要原因之一就是在概念上分为两层:视频编码层VCL(VideoCodingLayer)和网络抽象层NAL(NetworkAbstractionLayer),其中VCL负责高效的视频内容表示,它被设计成尽可能独立的网络,NAL负责对编码信息进行打包封装并通过指定网络进行传输。H.264中还定义了两种新的帧编码类型,即SP帧和SI帧来完成不同流的切换,可以根据传输网络和用户终端的具体情况自适应地在不同码率的视频流之间切换,这大大改善了视频流对3G网络的适应性。
一、3G视频通信中容错技术的应用
3G通信技术的出现使对话式无线视频业务成为可能,虽然3G网络在移动环境下的带宽可达384kbps,在静止环境下的带宽可以达到2Mbps,但是由于信道衰减、建筑物遮挡、终端移动、多用户干涉等原因影响,使得信道是时变且高误码的,因此,在3G网络上传输视频流时,仅仅追求高的压缩效率是不够的,必须有一定的容错和错误掩盖措施。最新的3GPP/3GPP2标准要求3G终端支持H.264/AVC视频编解码技术,同时由于硬件的限制,3G终端只支持部分H.264/AVC的容错工具。H.264中虽然提供了一些容错工具,但是它们有各自不同的用途和目的,即在不同的场合需要选择不同的组合来使用。
1.1错误隐藏技术由于错误隐藏技术能够利用接收到的数据来恢复丢失的数据,因此一般都应用在解码器端。在无线网络环境中,解码器的这种能力尤其重要,因为无线网络环境中误码率高,很多RTP包在传输中被网关或者路由器丢弃,而这些丢失的数据又必须在解码器端根据空间和时间上的相关性来恢复。错误隐藏技术的实现方法也很多,在JVT参考软件中,就使用了一种空间相关性的方法,即使用被丢失宏块周围的4个宏块来恢复被丢失的数据,其选用的标准是使恢复后边缘数据的SAD(sumofabsolutedifference)差最小。这种方法的效果虽不是最好,但是计算简单有效。
1.22Slice结构为了满足MTU大小的要求,在3G网络视频传输中对视频进行分片压缩显得尤其重要。经过分片压缩后的视频中每个RTP包中包含一个片,一般每个slice中包含一个或者几个宏块,并以RTP包的大小满足MTU的要求为准。
1.3帧内编码块刷新由于帧内编码不依赖时间上相邻帧的数据,所以帧内编码块能有效地阻止由于包丢失甚至帧丢失而引起的错误传播。对于对话式视频业务来说,由于实时性要求高,而且I帧刷新的频率较低,因此可以用帧内编码块来部分代替I帧的作用。H.264/AVC提供了两种帧内编码块刷新(intrablockrefreshing)模式;其中,一种是随机模式,即用户可以选择帧内编码块的数目,而由编码器随机决定哪些哪些位置上的宏块实行帧内编码;另一种是行刷新模式,即编码器在图像中依次选择一行进行帧内编码,但图像分辨率大小不同,每次需要帧内编码块的数目也不同,例如在QCIF格式图像中,每次需要选择一行,即11个宏块进行帧内编码,而在CIF格式图像中,这个数字变成22。
1.4参数集(ParameterSets)H.264标准中,取消了序列层和图像层,将原本属于序列和图像头部的大部分句法元素分离出来形成序列参数集SPS(SequenceParameterSet)和图像参数集PPS(PictureParame2terSet)。序列参数集包括了与一个图像序列有关的所有信息,如编码所用的档次和级别、图像大小等,应用于视频序列。图像参数集包含了属于一个图像的所有片的信息,如嫡编码方法、FMO,宏块到片组的映射方式等,应用视频序列中的一个或多个独立的图像。多个不同序列参数集和图像参数集被解码器正确接收后,被存储于不同的己编码位置,解码器依据每个己编码片的片头的存储位置选择合适的图像参数集来使用。
1.5冗余片(RedundantSlice)H.264编码器除了对片内的宏块进行一次编码外,还可以采用不同的编码参数对同一个宏块进行一次或多次编码,生成冗余片,冗余片的信息也被编码进同一个视频流中。解码器在能够使用主片的情况下会抛弃冗余片,反之如果主片丢失,也可以通过冗余片来重构质量。
1.6灵活的宏块排序(FMO)FMO技术通过片组(slicegroup)技术来实现。片组是由一个或者多个片组成,而每个片中通常包括一系列的宏块。采用FMO进行视频编码的好处在于,可以使因信道传输而引起的错误分散。具体实施方法是:帧图中的宏块可以组成一个或几个片组,每一个片组单独传输,当一个片组发生丢失时,可以利用与之临近的已经正确接收到的另一片组中的宏块进行有效的错误掩盖。片组组成方式可以是矩形方式或有规则的分散方式(例如,棋盘状),也可以是完全随机的分散方式。采用FMO提高了码流的容错能力,却使编码效率有所降低,同时也会增加编码延迟时间。
二、结论
通信技术的飞速发展,第三代数字无线移动通信网络以及多媒体信息服务(MMS)的兴起为无线移动环境下的多媒体通信业务(特别是视频)提供了应用和发展的需求.多媒体业务是3G的基本业务之一,然而视频通信业务对3G网络还是一种挑战,这是由于无线网络是一种易错网络,容易受到多径干扰、阴影衰落等多种条件的影响,致使视频传输流中的RTP包会大量丢失,因此对于3G无线网络中的视频通信业务,容错技术是不容忽视的。H.264/AVC视频编码标准本身提供了许多容错工具,可以很好的解决易差错信道的视频容错传输,提高3G视频通信的可用性。
参考文献:
[1]潘全卫.DHCP服务器容错方案[J].网管员世界.2009.(5):55-56.
关键词:3G视频通信H.264/AVC容错技术
传统的视频编码标准都是围绕比特流的概念组织的。实际上用于传送数字视频的大多数网络体系结构并不适合直接传输比特流。在许多网络体系结构中,比特流需要拆分为数据分组。这些分组的特性,如最小/最大尺寸、相关开销和差错属性等在网络体系结构间、甚至在某个给定的网络体系结构内也是很不相同的。假如视频编码器自身能和网络特性很好的匹配,将能够获得更好的视频QoS。问题是如何容错地支持易差错的无线移动网络?为了解决无线移动信道视频的容错传输,我们将采用如前向纠错编码及支持差错复原的视频压缩编码技术来解决。H.264编解码器可以很好的解决易差错信道的视频容错传输。在3GPP/3GPP2的传输环境下通过选择适当的条带长度使H.264编解码器和无线移动信道的网络特性得到很好的匹配,实现无线移动信道视频的容错传输。H.264标准适用于无线网络传输的主要原因之一就是在概念上分为两层:视频编码层VCL(VideoCodingLayer)和网络抽象层NAL(NetworkAbstractionLayer),其中VCL负责高效的视频内容表示,它被设计成尽可能独立的网络,NAL负责对编码信息进行打包封装并通过指定网络进行传输。H.264中还定义了两种新的帧编码类型,即SP帧和SI帧来完成不同流的切换,可以根据传输网络和用户终端的具体情况自适应地在不同码率的视频流之间切换,这大大改善了视频流对3G网络的适应性。
一、3G视频通信中容错技术的应用
3G通信技术的出现使对话式无线视频业务成为可能,虽然3G网络在移动环境下的带宽可达384kbps,在静止环境下的带宽可以达到2Mbps,但是由于信道衰减、建筑物遮挡、终端移动、多用户干涉等原因影响,使得信道是时变且高误码的,因此,在3G网络上传输视频流时,仅仅追求高的压缩效率是不够的,必须有一定的容错和错误掩盖措施。最新的3GPP/3GPP2标准要求3G终端支持H.264/AVC视频编解码技术,同时由于硬件的限制,3G终端只支持部分H.264/AVC的容错工具。H.264中虽然提供了一些容错工具,但是它们有各自不同的用途和目的,即在不同的场合需要选择不同的组合来使用。
1.1错误隐藏技术由于错误隐藏技术能够利用接收到的数据来恢复丢失的数据,因此一般都应用在解码器端。在无线网络环境中,解码器的这种能力尤其重要,因为无线网络环境中误码率高,很多RTP包在传输中被网关或者路由器丢弃,而这些丢失的数据又必须在解码器端根据空间和时间上的相关性来恢复。错误隐藏技术的实现方法也很多,在JVT参考软件中,就使用了一种空间相关性的方法,即使用被丢失宏块周围的4个宏块来恢复被丢失的数据,其选用的标准是使恢复后边缘数据的SAD(sumofabsolutedifference)差最小。这种方法的效果虽不是最好,但是计算简单有效。
1.22Slice结构为了满足MTU大小的要求,在3G网络视频传输中对视频进行分片压缩显得尤其重要。经过分片压缩后的视频中每个RTP包中包含一个片,一般每个slice中包含一个或者几个宏块,并以RTP包的大小满足MTU的要求为准。
1.3帧内编码块刷新由于帧内编码不依赖时间上相邻帧的数据,所以帧内编码块能有效地阻止由于包丢失甚至帧丢失而引起的错误传播。对于对话式视频业务来说,由于实时性要求高,而且I帧刷新的频率较低,因此可以用帧内编码块来部分代替I帧的作用。H.264/AVC提供了两种帧内编码块刷新(intrablockrefreshing)模式;其中,一种是随机模式,即用户可以选择帧内编码块的数目,而由编码器随机决定哪些哪些位置上的宏块实行帧内编码;另一种是行刷新模式,即编码器在图像中依次选择一行进行帧内编码,但图像分辨率大小不同,每次需要帧内编码块的数目也不同,例如在QCIF格式图像中,每次需要选择一行,即11个宏块进行帧内编码,而在CIF格式图像中,这个数字变成22。
1.4参数集(ParameterSets)H.264标准中,取消了序列层和图像层,将原本属于序列和图像头部的大部分句法元素分离出来形成序列参数集SPS(SequenceParameterSet)和图像参数集PPS(PictureParame2terSet)。序列参数集包括了与一个图像序列有关的所有信息,如编码所用的档次和级别、图像大小等,应用于视频序列。图像参数集包含了属于一个图像的所有片的信息,如嫡编码方法、FMO,宏块到片组的映射方式等,应用视频序列中的一个或多个独立的图像。多个不同序列参数集和图像参数集被解码器正确接收后,被存储于不同的己编码位置,解码器依据每个己编码片的片头的存储位置选择合适的图像参数集来使用。
1.5冗余片(RedundantSlice)H.264编码器除了对片内的宏块进行一次编码外,还可以采用不同的编码参数对同一个宏块进行一次或多次编码,生成冗余片,冗余片的信息也被编码进同一个视频流中。解码器在能够使用主片的情况下会抛弃冗余片,反之如果主片丢失,也可以通过冗余片来重构质量。
1.6灵活的宏块排序(FMO)FMO技术通过片组(slicegroup)技术来实现。片组是由一个或者多个片组成,而每个片中通常包括一系列的宏块。采用FMO进行视频编码的好处在于,可以使因信道传输而引起的错误分散。具体实施方法是:帧图中的宏块可以组成一个或几个片组,每一个片组单独传输,当一个片组发生丢失时,可以利用与之临近的已经正确接收到的另一片组中的宏块进行有效的错误掩盖。片组组成方式可以是矩形方式或有规则的分散方式(例如,棋盘状),也可以是完全随机的分散方式。采用FMO提高了码流的容错能力,却使编码效率有所降低,同时也会增加编码延迟时间。
二、结论
通信技术的飞速发展,第三代数字无线移动通信网络以及多媒体信息服务(MMS)的兴起为无线移动环境下的多媒体通信业务(特别是视频)提供了应用和发展的需求.多媒体业务是3G的基本业务之一,然而视频通信业务对3G网络还是一种挑战,这是由于无线网络是一种易错网络,容易受到多径干扰、阴影衰落等多种条件的影响,致使视频传输流中的RTP包会大量丢失,因此对于3G无线网络中的视频通信业务,容错技术是不容忽视的。H.264/AVC视频编码标准本身提供了许多容错工具,可以很好的解决易差错信道的视频容错传输,提高3G视频通信的可用性。
参考文献:
[1]潘全卫.DHCP服务器容错方案[J].网管员世界.2009.(5):55-56.
关键词:热备,集群,容错,数据同步,心跳机制,高可用性
0.概述
容错热备份系统就是指由至少一台主机,一台备机组成的一个集群,当在主机上运行的应用程序或者控制系统由于外界各种未知的干扰,而出现了停止,数据损坏或者丢失的情况下,集群会自动将主机上运行的应用程序或者控制系统切换到备机上继续运行,并且保证网络ip地址也随之进行切换,保证数据同步,使数据不丢失,不损坏。论文参考网。
本文主要研究了容错热备份系统的切换可靠性,方案的可用性以及监控过程中的心跳机制和切换当中的数据同步。分别验证了“N对1”和“N加1”的热备份方案。
1.容错热备份系统的原理介绍
Veritas ClusterServer(VCS),是一种高可用性集群软件,主要用在双机热备,容错系统中,保护数据,保持不间断服务。本文即采用Symantec公司的VCS软件达到对应用程序中进程的监控和切换。VCS使用的心跳协议是低延迟传输协议(LLT, Low LatencyTransport),LLT协议比IP协议更快并且可靠, LLT协议上方为组成员和广播协议(GAB, Group MembershipService Broadcast),由其发送广播。GAB为多点对多点的传输协议,有信息传输的安全保障功能, GAB驱动LLT,为整个集群提供了可靠的数据传输。高可用进程(High availability Daemon, HAD)是VCS的主要进程,在GAB上层注册,用以监控管理集群中物理机器的状态。在以上这些协议以及进程之上,VCS中,是最上层提供管理资源的逻辑的多县城进程。针对每个资源类型,都有相应的,监视对应类型的资源。原理构架如图一所示:
图一 VCS原理构架
2.容错热备份系统的方案对比
本文采取的容错热备份方案有以下两种:N对1热备份方案和N加1热备份方案。论文参考网。论文参考网。
2.1 N对1热备份方案
N对1的热备份方案主要采用的是非对称的故障切换模式,提供了一个专用的备份服务器,整个集群中的N台主机对应一个备机,当任何一台主机发生故障时,集群会将该主机的应用程序切换到这一台备机上,由于提供了专用备机,没有在同一台计算机上运行多个应用程序而互不兼容的风险。
2.2 N加1热备份方案
N加1热备份方案主要采用的是对称故障切换模式,该方案下,不需要专门的冗余服务器,集群中的一台额外服务器只是用作备份容量,集群中的某台主服务器出现故障时,可以通过之前的配置,切换到集群中任意一台机器上,任何服务器可以为其它服务器提供冗余。
3.容错热备份系统的实现及验证结论
本文的实验环境采用3台Linux操作系统的计算机作为容错热备份系统的物理节点,挂接磁盘,分别用来验证N对1和N加1方案的可行性。
本文论证了三种情况:1.杀死主机上正在运行的应用程序的进程(即可认为是应用程序出现问题的情况);2.主机与公网断网的情况;3.主机意外宕机的情况。以上三种情况下,该容错热备份系统均能成功检测并且平滑切换,保证了数据同步,数据信息无损失。
通过对容错热备份系统的深入研究,以及多种不同热备份方案的比较,得出以下结论:本文采用的容错热备份系统,适用性广泛,对于各种不同的领域,均可达到网络信息与服务高可靠性的持续运行,并且保证数据的同步。
【参考资料】
[1]张艳,李舟军,何德全.灾难备份和恢复技术的现状与发展[J].计算机工程与科学,2005,(02).
[2]刘迎风,祁明.容灾技术及其应用[J].计算机应用研究,2002,(06).
[3]刘卫平.网络存储中的数据容错与容灾技术研究[D].西北工业大学, 2006.
[4]于雪松,王孝良,张雪源.具有双机热备功能智能电网数据采集系统[J].东北电力技术2010,(01).
[5]王丽华.计算机容错系统的体系结构与安全性研究[D].西南交通大学,2002.
[6]李海山.面向恢复的容错计算机技术研究[D].哈尔滨工程大学,2007.
[7]何晓琴,胡勇,常有渠.一种低成本的数据库热备份方法[J].重庆电力高等专科学校学报,2008,(04).
[8]陈筠,桑楠,熊光泽. 一种容错实时计算机体系结构的研究与实现[J].电子科技大学学报,2007,(05).
[9]毛睿.“双机容错”在我院信息系统中的应用[J].电脑知识与技术,2008,(35).
参考文献的写作是帮助读者更好的研读这篇文章,可以知道作者在论文的撰写过程当中查阅了哪些学术文献资料,关注学术参考网,可以查看更多优秀的论文参考文献。下面是小编采编收集的关于信息技术论文参考文献,欢迎大家阅读借鉴。
信息技术论文参考文献:
[1]肖勇.面向航天的多源信息流系统综合诊断与容错研究[D].东华大学2010
[2]姚克明.火星无人机控制与自主导航关键技术研究[D].南京航空航天大学2011
[3]闫鑫.基于滑模的航天器执行机构故障诊断与容错控制研究[D].哈尔滨工程大学2012
[4]高春岩.基于模型的执行器故障诊断及其在卫星姿控系统中的应用[D].哈尔滨工业大学2013
[5]栾茹,傅德平.24kV蒸发冷却汽轮发电机定子绝缘结构的可行性研究[J].中国电机工程学报.2005(11)
[6]胡国,李朝晖,杨兴斌,曾洪涛.葛洲坝电厂19F机组励磁系统状态监测与诊断[J].水电自动化与大坝监测.2005(02)
[7]程养春,李成榕,王伟.发电机局部放电脉冲沿定子绕组传播规律的研究[J].电网技术.2005(08)
[8]张筱磊.基于概率模型的故障诊断及在航天器中的应用[D].哈尔滨工业大学2013
[9]李朝晖,杨贤,毕亚雄.水电机组数字化及其工程应用[J].电力系统自动化.2008(23)
[10]程养春,李成榕,王伟,林耀洲.发电机定子局部放电检测中励磁干扰耦合规律的研究[J].电网技术.2005(03)
信息技术论文参考文献:
[1]杨贤.面向智能水电站的远程监测与分析系统[D].华中科技大学2012
[2]谢国财.基于团队智能的水电机组集成监测方法研究与实践[D].华中科技大学2012
[3]管宇.卫星姿态控制系统的故障诊断与容错方法研究[D].哈尔滨工业大学2012
[4]金洋.基于传递系统模型的在轨卫星故障诊断方法研究[D].哈尔滨工业大学2013
[5]胡雷.面向飞行器健康管理的新异类检测方法研究[D].国防科学技术大学2010
[6]宋其江.基于有向图模型的故障诊断方法研究及其在航天中的应用[D].哈尔滨工业大学2010
[7]梁伟光.基于证据理论的在轨航天器故障诊断方法研究[D].中国科学技术大学2011
信息技术论文参考文献:
[1]肖志怀.水利枢纽闸门维护自动化-故障诊断技术研究[D].华中科技大学2004
[2]郭江.电厂维护中基于虚拟现实及智能的人机融合技术[D].华中科技大学2004
[3]陈燚涛.水轮机调速系统优化维护理论与实践[D].华中科技大学2005
[4](美)戴维斯(Davis,B.),编.项目经理应该知道的97件事[M].人民邮电出版社,2011
[5]何声武[着].随机过程引论[M].高等教育出版社,1999
[6]刘明军.变压器局放超高频监测与基于知识的分析方法研究[D].华中科技大学2011
[7]徐永.大型水轮发电机组轴系动力学建模与仿真分析[D].华中科技大学2012
[8]杨贤.面向智能水电站的远程监测与分析系统[D].华中科技大学2012
[9]艾远高.基于虚拟现实的水电机组状态监测分析方法研究[D].华中科技大学2012
[10]邓友汉.双馈风力发电机最大风能捕捉及低电压运行技术研究[D].武汉大学2014
[11]许波峰.基于涡尾迹方法的风力机气动特性研究[D].南京航空航天大学2013
[12]谢国财.基于团队智能的水电机组集成监测方法研究与实践[D].华中科技大学2012
[13]孙鲜明.复杂工况下风力发电机组关键部件故障分析与诊断研究[D].沈阳工业大学2014
[14]艾友忠.葛洲坝电厂最优维护方法研究与实践[D].华中科技大学2007
[15]万元.大型发电机局部放电在线监测与分析方法研究[D].华中科技大学2009
【关键词】容错技术硬件冗余 VHDL代码
1 引言
数字硬件电路设计越来越精密,但其故障的检测也越来越难。而数字电路的设计大都是用VHDL语言来描述的,因此提出了一个在VHDL描述中自动插入故障容错结构的工具。采用这种工具来做容错电路的设计,用户可以根据不同的需求在VHDL源码级自动做电路故障容错设计。
2 电路源码级故障容错的插入工具
数字电路自动化实现故障容错,也就是在用VHDL语言设计数字电路时,自动化的加入故障容错结构,并且最后得到具有容错功能的VHDL描述的数字电路。这个自动化的过程用一个工具来实现,也就是故障容错结构自动插入工具。该工具由六部分组成,如图1所示。
VHDL源码经过分析器转化成一种特殊的中间数据格式,存储在设计库中;这种数据格式以有向无环图(DAG)的形式组织起来,保存了VHDL完整的语义信息。用户通过用户接口输入某些信息,来定位所需容错的关键部件及从故障容错器选择所用的容错器件。容错后的数据重新送回到设计库中,用反编译系统再次恢复成VHDL代码。本文对基于硬件冗余技术对源码级容错结构插入过程进行阐述。
3 硬件冗余技术
硬件冗余技术采用在系统中多加的硬件资源,包括被动冗余、主动冗余及主被动相结合三种形式。
被动冗余又称为静态冗余(Masking Redundancy ),它不改变系统的结构,靠附加的元器件来屏蔽掉故障元器件的作用。常用的被动冗余称为三模冗余(Triple Modular Redundancy, TMR)结构。系统由相同功能的三个模块及表决器构成,三个相同模块同步运行,三个模块的输出作为表决器的输入,系统的输出是多数表决的结果。
所谓的主动冗余技术,就是能让系统配置动态的改变,从而消除故障对系统的影响,同时补充系统冗余。当系统模块发生故障时,依靠存储多个模块和故障检测机构,通过系统内部的一次重组来切除或替换故障模块。
4 硬件冗余的插入过程
数字电路设计者在使用该工具时,首先需要编写电路的VHDL源码、同时要提供采用的容错技术类型及想要的容错的位置(设计单元名和需复制的对象名)这些信息。
此处假定需要容错的位置是:设计单元A,需复制的对象RESULT,而容错技术采用硬件被动冗余中的三模冗余技术。插入技术主要由以下过程来实现。
4.1 三个新信号的拷贝
如图2所示,首先通过设计库的search(pname,sname)函数从库中找到用户所输入的设计单元A,然后再使用符号表的 search(object_name,global)函数从符号表中查找目标对象RESULT,进行相对应的属性修改后,清空temp。经过这些步骤后,完成了三模冗余技术所需要的新对象的声明。
4.2 语句的复制
如图3所示,该流程图是对于语句的修改。
经过上面的步骤,完成了三模冗余技术的对象复制部分,将这些信息修改完成后再返存入设计库中,实现了在数字电路的VHDL源码级进行故障容错结构的插入。
5 结语
利用自动化工具在数字电路的VHDL源码级进行故障容错结构的插入,能够有效的提高设计者的工作效率。
参考文献
[1]徐拾义.容错计算系统[M].武汉:武汉大学出版社,2010.
[2]L.Entrena,C.Lopez,E.Olias.Automatic insertion of fault-tolerant structures at the RT level.7th IEEE Int.On-Line Testing workshop,July 2001,48-50.
[3]齐星刚.VDHL编译器设计技术研究[D]. [硕士学位论文].成都:四川大学,2013.
[4]Isabel Gonzalez,LuisBerrojo. Supporting fault tolerance in an industrial environment:the AMATISTA approach.7th IEEE Int.On-Line Testing workshop,July 2001,178-183.