时间:2023-09-18 17:04:19
序论:在您撰写网络行为审计时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
关键词:方法;维修性评估;BP神经网络
1 概述
维修性是现代航空武器装备重要的设计特性,是影响其使用可用度和作战效能的重要因素。定型试飞阶段是装备维修性评价的重要环节,其目的是验证装备的维修性水平是否达标,为改进装备维修性设计提供重要参考,提高装备的维修性水平。试飞阶段的维修性评价主要是通过试飞阶段产生的维修信息,验证装备的维修性水平。维修性评估除了有量化指标要求外,还有很多是一些非量化和无法量化的要求和指标。对这些非量化的指标和要求进行评价是非常困难的,往往不易下结论或者结论不够准确。目前,人们一般采用层次分析法(AHP)、模糊综合评判法或灰色评价法进行评价,但这些方法具有较强的主观性,缺乏自学习能力,实际评判中易受判定随机性、参评人员主观不确定性及认识模糊性等诸多因素的制约。针对以上情况,文章在建立维修性定性评估指标体系的基础上,采用目前比较成熟且最常用的一种神经网络方法,即BP神经网络,建立了评价模型,并给出了评价结果。
2 BP神经网络方法
人工神经网络是在现代神经生理学和心理学的研究基础上,模仿人的大脑神经元结构特性而建立的一种非线性动力学网络系统,它由大量简单的非线性处理单元(类似人脑的神经元)高度并联、互联而成,具有对人脑某些基本特性的简单的数学模拟能力。
2.1 BP网络结构
BP神经网络是一种单向传播的多层前馈神经网络,由一个输入层、一个输出层和若干中间层(隐层)构成。每层由若干神经元组成,不同层次的神经元之间形成全互连接。层内神经元相互独立,不同层次之间的神经元以权值W单向连接。每层神经元在节点接受前一层的输出,同时进行线性复合和映射(线性或非线性),通过复合反映不同神经元之间的耦合和映射对输入信息作出反应。
BP神经网络对于输入值要先向前传播到隐层节点,经作用函数运算后,再把隐层节点的输出信息传播到输出节点,最后给出输出值。文章采用一种具有个n2输入节点、n1个隐层节点和单个输出节点的三层BP神经网络,它的数学模型是:
Y=f(WijX+?兹1) (1)
Z=f(WjY+?兹2) (2)
其中,X,Y,Z分别为输入层、隐层和输出层矢量(节点向量);Wij,?兹1和Wj,?兹2分别表示输入层与隐含层以及隐含层与输出层之间的连接权和阈值,i=1,2,…,n2;j=1,2,…,n1;f(x)为网络激活函数或传递函数,通常采用S形函数,即f(x)=■,如果整个网络的输出要取实数域内任何值,则网络输出层可以采用线性函数作为传递函数,即f(x)=x,其结构如图1所示。
图2 图1中神经元j的结构模型
图1中Xk=(xp1,xp2,?撰,xpn2)为评价指标属性值,k=1,2,…,s,其中s是输入样本量;Z为样本模式P的输出。B=[b1,b2,?撰,bs]T=[bp]s×1为与样本模式P对应的评价结果,也是神经网络的期望输出值。实际输出Z与期望输出bp的误差函数Ep定义为Ep=(bp-Z)2/2。
对于图1中隐层的神经元j,其结构模型如图2。
神经元j模型可以表示为:
(3)
2.2 BP网络学习过程
BP神经网络的学习过程由正向传播和反向传播两部分组成,在正向传播过程中,输入模式从输入层经过隐层神经元的处理后,传向输出层,每一层神经元的状态只影响下一层神经元状态。如果在输出层得不到期望的输出,则转入反向传播,此时误差信号从输出层向输入层传播并沿途调整各层向连接权值和阈值。以使误差不断减小,直到达到精度要求。该算法实际上是求误差函数的极小值,它通过多个样本的反复训练,并采用最快下降法使得权值沿着误差函数负梯度方向改变,并收敛于最小点。
3 维修性定性评价指标体系
根据GJB 368B装备维修性通用工作要求中维修性定性评价内容可确定维修性定性评估的指标体系如图3所示。
图3 维修性定性评价指标体系
维修性评价的最主要目的就是得出分析对象的维修性好坏。对于二级指标,这里为了方便现场操作人员评价打分,每个指标又细化为多个评价准则。这里给出了互换性与标准化评价准则表,见表1。操作人员只需对评价准则进行回答,即可得出每个指标的评价值。文章以可达性中视觉可达为例介绍专家打分方法和评价过程。由于影响视觉可达的条件不同,因此具体项目和分值应根据实际操作进行调整。打分共有好、中、差等3项指标,“好”指标对应分值为80~100分,“中”指标对应分值为60~80分,“差”指标对应分值为60分以下,满分100代表最好的视觉可达状况。为了便于神经网络训练,对得到的百分制评价结果进行了处理,即每个分值除以100得到神经网络输入向量的元素,例如,如果专家对视觉可达的最终打分结果是85分,对应文章的输入向量的元素值为0.850。
附表1 互换性与标准化评价准则表
4 维修性BP神经网络评估模型
文章利用MATLAB实现BP神经网络的编程。将维修性定性评估指标体系中的16个指标作为神经网络的输入向量,将其评估结果作为唯一输出,建立一个如图1的16×midnote×1的3层BP神经网络。
其中16是输入样本的维数;
midnote是隐层节点数,隐层节点数目太多会导致学习时间过长、误差不一定最佳,也会导致容错性差、不能识别以前没有看到的样本,因此一定存在一个最佳的隐层节点数。以下3个公式可用于选择最佳隐层节点数时的参考公式:
(1)■C■■>k,其中k为样本数,n1为隐层节点数,n2为输入节点数。如果i>n1,C■■=0;
(2)n1=■+a,其中m为输出节点数,n2为输入节点数,a为[1,10]之间的常数;
(3)n1=log2n2,其中,n2为输入节点数。
1 是输出层节点数。
网络输入层与隐层之间的传递函数f(x)为tansig,即S型的双曲正切函数;隐层与输出层之间的传递函数f(x)为purelin,即f(x)=x;网络训练函数为traingd,即梯度下降BP算法函数;对于BP网络创建函数newff,其性能函数默认为“mse”,即均方误差性能函数,其权值和阈值的BP学习算法默认为“learngdm”。下面将介绍学习步长、初始权值和目标精度的选取要求。
4.1 学习步长、初始权值、目标精度的选取
学习步长是在学习过程中对权值的修正量,与网络的稳定性有关。步长过短,则学习效率低,步长过长,则网络稳定性差,学习步长一般取0.05。
初始权值选取和输出结果是否最接近实际,是否能够收敛,学习时间的长短等关系很大,由于MATLAB仿真软件会根据初始化函数自动生成相应的初始权值和阈值。
目标精度是确定神经网络的精度标准,当误差达到目标精度要求后网络停止。目标精度的确定是根据实际情况对精度的要求而定。
4.2 实例验证
训练根据实际数据和专家评定,选定用于训练和测试的10组样本数据,其中X矩阵的前9行,即9组训练样本,X矩阵的第10行为1组测试样本,B为10组样本的目标输出矩阵,Q为待估样本矩阵。
(1) 学习样本矩阵、目标输出矩阵、待评估矩阵的数据输入
(2)BP神经网络模型程序代码设计:
net=newff (min max(X(1:9,inf)'), [midnote 1], {'tansig','purelin'},'traingd')%创建网络并初始化
net.trainparam.show=50 显示训练状态间隔次数
net.trainparam.lr=0.05 学习步长
net.trainparam.epochs=500 仿真次数
net.trainparam.goal=0.001 目标精度
[net,tr]=train(net, X(1:9,inf)',B') 网络训练
Zsim=sim(net, X(10,inf)') 仿真计算
(3)仿真结果输出及分析
待评估矩阵的仿真结果为:Zsim=0.762066,它表示的意义是在16个二级评估指标能力值分别为待评估矩阵所给定值时,该维修性的评估结果是0.762066。图4为BP神经网络训练图。从图中可以看出,训练仿真到351次时,达到设定的目标精度0.001,训练停止。文章只对BP神经网络解决维修性评估的方法上进行了初步的探索,随着装备维修性研究的不断深入和神经网络技术的发展,BP神经网络方法在维修性评估中的应用将更加广泛。
图4神经网络训练误差曲线
5 结束语
文章将BP神经网络方法应用于对航空维修性的评价,意在建立更加接近于人类思维模式的定性与定量相结合的综合评价模型。通过对给定样本模式的学习,获取评价专家的经验、知识、主观判断及对目标重要性的倾向,当需对有关对象作出综合评价时,便可再现评价专家的经验、知识和直觉思维,从而实现了定性分析和定量分析的有效结合,也较好地保证了评价结果的客观性,此外仿真结果精确度高,可信性强。
参考文献
[1]黄书峰,端木京顺,唐学琴,等.航空维修保障能力的神经网络评估方法与应用[J].航空维修与工程,2008.
[2]GJB 368A-1994.装备维修性通用大纲[S].
【关键词】 神经网络; 财务危机; 预警模型
一、企业财务危机预警的现实意义
财务危机是由于种种原因导致的企业财务状况持续恶化,财务风险加剧,出现不能清偿债务的信用危机,直至最终破产的一系列事件的总称。财务危机将危害到企业正常的生产经营,制约企业的发展后劲,打乱企业正常的生产经营秩序,挫伤职工的生产积极性等。而有效的企业预警机制能够起到提高企业危机管理意识,提高企业适应能力和竞争能力等作用,对企业进行有效的监督和预警也直接关系到企业相关利益人决策、市场竞争机制的客观要求、财务监督、财务预测等方面。所以,对我国企业财务危机进行有效的预警就变得迫切和必要。
二、财务危机预警模型指标体系的选择
任何一种经济现象都具有多方面的特征,财务指标体系就是对经济现象特征的整体描述。在以往的研究成果和我国的企业评价指标体系的基础上,结合我国企业的具体特征,充分考虑各个指标的实际应用效果和获取指标的难易程度,可选择下列指标来建立适合我国企业财务危机预警模型的指标体系:资产负债率;流动比率;净资产收益率;总资产周转率;主营业务收入增长率和每股经营活动产生的现金流量净额。这些指标兼顾到了偿债能力、盈利能力、资产营运能力、增长能力以及现金流量状况五个方面,同时鉴于针对的是企业的财务危机的预警指标,所以在选择构成指标时,也适当侧重了企业的偿债能力和盈利能力指标。
三、基于BP神经网络的财务危机模型的建立及预测结果分析
(一)BP神经网络原理与财务危机预警的可行性分析
BP神经网络是一种调整连接权值及结点阈值时采用的误差逆传播学习方法,是一种典型的误差修正方法。其基本思想是:把网络学习时输出层出现的与“事实”不符的误差,归结为连接层中各单元间连接权值及阈值的“过错”,通过把输出层单元的误差逐层向输入层逆向传播以“分摊”给各连接单元,并据此对各连接权进行相应的调整,使网络适应所要求的映射(图1)。而财务危机预警的6项指标与企业的财务状况之间的关系是很难用普通的方法加以定量化的表述,而通过大量的样本表现出的数学统计学特征的准确表达正是神经网络的优势所在,为此,我们认为神经网络是可行的。
(二)财务危机预警模型样本的选择
考虑到我国近几年在经济、法律、会计方面进行了较大的政策调整,因此在选择样本的过程中我们选取了信息较为连续可比、取得较为容易的上市公司中制造业行业的6个子行业2000―2002年之间的数据,选择了行业中25家ST公司和25家非ST公司作为训练样本,ST公司样本数据为其被ST的前一年的数据资料,随机选择的非ST公司的样本数据为与ST公司同期的数据。我们还选择了2003年同行业的38家ST公司和随机选择的同期非ST公司作为检验样本,用模型的预测结果与已知的实际结果进行对照,以检验模型的准确性。选择这一期间的样本数据是因为这些样本数据的时间跨度不大,在这几年中,国家的会计制度、税收政策和退市制度也没有太明显的变化,整个国民经济的发展比较稳定,无明显的经济周期影响。
(三)网络结构及参数的选取
1.网络结构的确定
输入节点数由控制的目标确定,控制目标为6个,因此输入节点数为6个;输出节点数由风险因素确定,输出节点为2个。一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数,增加隐层数主要可以更进一步降低误差,提高训练的精度,本系统中只设一个隐含层,主要通过调节隐层节点数、动量项、学习率提高网络的训练精度。
2.各参数选取
把经过处理后88组样本数据输入到神经网络,前50组作为训练样本,后38组作为预测样本,网络的预期误差0.001。利用神经网络系统对学习数据反复训练,得到实验结果最好的一次,各参数如下:
动量项?准=0.3;学习率?浊=0.4;学习次数n=10000;隐层节点数p=6;网络实际误差?孜=0.0024
(四)财务危机预警预测结果分析
利用前述训练结果,对38个检验样本进行预测,预测的结果(表3)根据下列标准进行判断,如果预测结果逼近于1,则判断为非财务危机公司,如果预测结果偏离1就可判断有财务危机的可能性,可以发出财务危机预警。
通过预测结果与实际结果的比较,可以得出以下验证结果:
1.对于非ST公司,预测的准确率为94.74%;
2.对于ST公司,预测的准确率为84.21%;
3.综合预测准确率为89.47%。
四、该财务危机预警模型的局限性分析
利用神经网络进行财务危机预警模型的研究,从模型的训练和预测结果可以看出,还是具有一定的可行性和有效性。但也存在一些问题:
(一)忽视了企业规模对企业财务状况的影响
本次研究中所选择的ST样本是所属行业的全部样本量,而配对样本则是随机抽取的,在选择的过程中,没有重点关注企业规模对财务危机指标标准的不同要求。
(二)非ST样本公司的代表性
所选取的ST企业被界定为财务危机公司还不容易引起争议,但对非ST公司而言,每个公司仍然存在财务状况非常好、较好或一般的差异,因此用不同的非ST公司和ST公司配对,就不能排除财务危机公司财务状况之间的差异,这也直接影响了预测数据判别的准确率。
(三)ST界定自身具有的不适应性
根据我国对ST公司的划分标准,可以看出其主要看中的还是公司的盈利能力和资本结构比率,而财务危机是企业综合财务状况出现问题的集中表现,它受到多项能力和指标的影响,两者之间并不对等。
(四)神经网络理论自身的缺陷
神经网络自身擅长解决不精确和模糊的信息处理问题,在处理过程中,他会有自动删除样本“噪声”和自动调整的功能,如果其修正数据的过程中出现偏差,或训练过程中参数确定的不准确,也会直接影响预测的准确性。
(五)样本选择的局限性
本次预测过程中受诸多因素的影响,所选择的样本不具有普遍的代表性,局限在了上市公司,连续数据的选择也导致了数据的时效性较差,对当前新经济形势下的企业财务危机的参考作用有待观察。
五、结论
财务危机预警模型通过神经网络原理,在目前是可以实现的,只要在模型建立的过程中,将不稳定因素的影响降低到最低,就可以极大地提高预测的准确率。另外,由于不同的行业有其不同的生产和财务特性,他们的数据表现的要求也不尽相同,因此对于差异较大的行业,应适当建立行业财务危机预警模型,以更好地提高预测的准确程度。
当然,企业财务危机预警模型作为财务危机预警系统的一个有机组成部分。它的作用必须借助于整个系统作用的发挥,也需要企业的高层管理者确实认识到财务危机预警的必要性,才能真正实现对财务危机抑制和防范作用。
【参考文献】
[1] 卢雁影.财务分析[M].湖北:武汉大学出版社,2002:296-303.
基金项目:国家社科基金重大项目(10ZD&054)。
作者简介:钟阳(1982―),女,满族,黑龙江哈尔滨人,吉林大学经济学院博士研究生,主要从事国际金融研究;丁一兵(1973―),男,湖北武汉人,吉林大学经济学院教授,博士生导师,主要从事世界经济、国际金融研究;何彬(1979一),男,云南昆明人,吉林大学国有经济研究中心博士,主要从事应用计量经济学、公共经济学研究。
中图分类号:F821.0
文献标识码:A
文章编号:i006―1096(2012102-0070―05
关键词:人工神经网络;连拱隧道;围岩分类;围岩稳定性分析
中图分类号:U452.12文献标识码:A
文章编号:1672-1098(2012)03-0007-05
对隧道围岩稳定性进行分析评价的前提是通过各种手段确定围岩的稳定性类别。围岩分类是应用工程类比方法进行围岩评价,为工程的设计和施工提供依据的基础,具有重要的实用价值。围岩分类,以及在此基础上对各类围岩的成洞条件、开挖、支护要求做出评价,并以此作为设计和施工的依据,是国外在二十世纪四十年代就很通用的方法。但是,随着人类对岩体力学特性认识的深入,隧道工程经验的积累和隧道工程施工技术的发展,围岩分类的原则和分类系统也在不断的改进和完善[1-5],而现有的围岩分类方法,大多是根据围岩情况进行的主观判断,定量的手段还不尽完善。
1工程概况
铜(陵)-黄(山)高速公路屯溪至汤口段呈近南北向通往我省黄山风景区,它是加速我省经济和旅游发展,加强安徽省与江、浙、赣、沪等省市联系的重要交通干道。皖南山区地形复杂,高速公路穿越各种地貌单元,特别是黄山汤口-歙县程坎等地段山高坡陡,为保护黄山风景区的自然和生态环境免受破坏,高速公路都以隧道穿越,其中富溪隧道位于黄山市徽州区富溪乡境内,地质条件相当复杂,是该高速公路上的一座双连拱隧道,全长649 m,最大埋深122.0 m。隧道单幅设计净宽9.88 m,双幅净宽22.06 m,净高6.83 m,设计时速80 km/h,设计荷载为汽车超-20、挂车-120,2%单向横坡,路线前进方向为1%向上纵坡,直线型隧道。
隧址区地处休宁盆地边缘,地质条件较为复杂。构造形态上表现为一南翼被截断的复背斜,地层主要由中元古界蓟县系牛屋组和大谷运组及镇头组组成[6]。
2围岩稳定性分析
2.1人工神经网络简介
人工神经网络(ANN)理论是人工智能领域的新技术,其独特的拓扑结构和信息处理特点,很适于解决岩土工程中“宽而浅”及非线性、非定量的技术问题。是由大量的处理单元(神经元,即网络节点)组成的高度并行的非线性动力学系统。人工神经网络的知识获取只需提供样本(范例),因而易于获取隧道工程知识、管理特性;工作时通过感知环境变化,由神经元的微活动产生系统的宏效应[7]。因此,人工神经网络非常适于用来进行隧道围岩分类。
2.2围岩分类的神经网络模型构建
由于遂道围岩稳定性受多种因素的影响,且各种影响因素的作用相互交叉,某种因素的影响程度会因地、因时、因工艺不同而变化。在网络模型中,要全面考虑所有的影响因素,目前还是不可能的;只能考虑一些起重要作用的因素,根据大量现场观测结果和实践经验,并参照文献[4]的方法选取如下的主要影响因素:
1) 岩石质量指标(RQD);
2) 岩石单轴饱和抗压强度RW/(MPa);
3) 岩石完整性系数(KV);
4) 结构面强度系数(KF);
5) 地下水渗水量W(L·min-1)。
选取以上确定的5个主要影响因素作为网络的输入节点,即输入节点数为5个。输出节点即是反映围岩分类结果的定量指标,也选取5个节点;对围岩稳定性,根据文献[8]及国内岩分类的经验,将围岩分为五级,为简化算法和提高学习速度, 采用规一化法对分类标准进行处理,归一化后的分类标准如表1所示。学习训练时网络输出节点的期望输出值所代表的围岩类别[9-14]如表2所示。
2.3神经网络结果检验
利用收集到的统计资料, 选取12个样本(表3前12个数据)对围岩分类神经网络进行学习训练。 由于现场测量样本过少, 而且要留取一部分样本用于训练好了的BP网络中, 来识别围岩类别, 因此,为了有足够的学习样本空间, 提高网络的判别能力。根据文献[8]构造了表3中的后12个学习样本。
训练时隐层节点数取6,迭代次数为仅为6次,控制误差为0.00001;学习完成后即建立辨识模型,然后选取3个样本对网络进行检验,检验结果如表4所示。
学习训练时,网络均采用导入规则将各输入节点的指标值转变为[0,1]区间的数值;也将神经元计算后的在[0,1]区间的输出节点输出值按导出规则转变为原来的表达形式。其中,第二组网络输出数据为(0.05, 0.08,0.82,0.92,0.08),分析可能是Ⅳ类,也可能是Ⅲ类围岩,但Ⅳ类围岩可能性较大。
2.4分析结果
用训练好的网络对富溪隧道各测设段进行了分类(见表5)。其中K205+828~K205+970段的样本,经网络处理后最终输出为(0.05, 0.10, 0.85,0.72,0.02),第三节点和第四节点输出值较接近,说明该段岩体分类等级判为IV偏III或III偏IV,但前者可能性较大。
由于现行公路隧道围岩分类标准与文献[8]分类标准不同,但有关联性,文献[15]将围岩分为六级,但第六级主要考虑的是土体,而文献[8]主要以岩体为分类对象。因此,对于岩体稳定性分类,上述两种分类体系在围岩分类级别上是一致的。经上述方法确定的富溪隧道围岩分类结果与专家确定的围岩分类结果对比如表6所示。
上述围岩分类结果与专家意见基本一致,这说明运用BP神经网络模型对围岩进行分类是可行的,结果的准确性是可靠的。
3结论
1) 从表4的检验结果看,围岩分类神经网络模型的辨识正确率较高,具有准确、简便等特点,可以考虑大量影响因素,这些因素既可以是定量因素,也可以是定性或不确定因素,这是其它方法难以比拟的;该模型不仅免除了其它方法中对所选择的影响因素要事先赋予权值的过程,而且也不需要对各影响因素进行复杂的相关性分析,重复的因素或者没有影响的因素加入输入值也不会影响最后的结果,它们的权值会在运算中自动地迭代到零,这就给选择输入节点创造了比较宽松的条件。因此,BP神经网络用于隧道围岩分类的方法值得进一步完善和推广。
2) 由表7知,富溪隧道整体围岩稳定性较差,尤其是隧道进口和出口(占隧道全长的27.1%),为极不稳定围岩段。就隧道整体围岩类别而言,综合判定富溪隧道围岩稳定性介于稳定差和极不稳定之间。因此隧道成洞施工时应注意选用适当的施工方法,避免大面积整体开挖,应充分做好超前支护及初期支护,施工爆破时应注意选取适当药量。雨季施工时,应严格做好防止边坡滑塌措施。
参考文献:
[1]于学馥,郑颖人,刘怀恒,等.地下工程围岩稳定分析[M].北京:煤炭工业出版社,1980:23-35.
[2]陈振平,王鹏. 基于BP神经网络的隧道围岩分类[J].路基工程,2011(1):97-99.
[3]周盛全.铜(陵)-黄(山)高速公路富溪隧道围岩分类及稳定性研究[D].合肥:合肥工业大学,2006.
[4]朱素平,周楚良.地下圆形隧道围岩稳定性的粘弹性力学分析[J].同济大学学报,1994,22(3):329-333.
[5]CHARLES FAIRHURS,JUEMIN PEI.A Comparison Between the Distinct Element Method and the Finite Element Method for Analysis of the Stability of an Excavation in Jointed Rock[J].Tunnelling and Under-ground Space Technology, 1990, 5(1):111-117.
[6]王军号,孟祥瑞.可视化煤矿巷道支护设计专家系统的开发研究[J].煤炭工程,2011(5):7-9.
[7]雷学文,汤斌,王瑞芳.工程围岩稳定性分类的人工神经网络识别[C]//中国岩石力学与工程学会第七次学术大会论文集.北京:中国科学技术出版社,2002:300-301.
[8]水利部东北勘测设计研究院.SL279-2002 水工隧洞设计规范[S].北京:中国水利水电出版社,2003.
[9]丛爽.面向对象MATLAB工具箱的神经网络理论与应用[M].第2版.合肥:中国科技大学,2003:15-24.
[10]Y YANG,Q ZHANG.A Hierarchical for Rock Engineering Using Artificial Networks[J].Rock Mechnics and Rock Engnieering,1997,30(4):207-222.
[11]闻新,周露,李翔,等.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003:68-75.
[12]周志华,曹存根.神经网络及其应用[M].北京:清华大学出版社,2004:15-19.
[13]饶运章,侯运炳.神经网络方法在围岩稳定性分级评价中的应用[J].黄金,2001,22(10):15-17.
关键词:室内定位;RSS; BP神经网络;IEEE 802.11b
中图分类号:TN911.23 文献标识码:A
1 引 言
目前,室内定位算法主要有以下几种。
1)Time of arrival(TOA)
TOA定位的基本原理是通过测量节点间电波传播的时间来确定节点的位置。
TOA算法要求参加定位的各个基站在时间上实现严格同步。在室内环境中,由于已知点到待测点的距离通常不远,无线电波的传播速度太快,且存在严重的多径干扰,因此无法利用无线电波进行测距。目前,基于TOA的室内定位技术通常是利用超声波传播速度较慢的特点(在20摄氏度时超声波的传播速度为343.38m/s),来测量出已知点和待测点间的距离,进而求出待测点的位置[1]。
2)GPS L1 Re-radiating
GPS(Global Positioning System)是70年代初由美国开发的卫星导航定位系统,本质上它也是一个基于TOA的定位系统。
GPS L1 Re-radiating是将GPS在L1频段上的信号,通过户外天线接收后,增益放大为室内可接收信号,进而基于GPS实现室内定位。
3)Received signal strength,RSS
RSS定位的基本原理是利用移动装置侦测所接收到的无线电波信号强弱,然后根据经验模型或RSS随距离衰减的模型来推断节点间的距离,进而实现定位[2]。
该技术主要使用无线网络本身的无线电信号来定位,不需额外添加硬件,是一种低功率、廉价的定位技术[3]。
基于信号强度的室内定位方法分为经验模型法和信号衰减模型法。
(1)经验模型法
在经验模型法中,将RSSI数据转换为位置信息的方法主要有判定法和概率法两种。
(2)信号衰减模型法
信号衰减模型法则无需实地测量位置和RSSI,而是依据信号强度和距离的特定关系,结合三角测量法,根据来自三个(或以上)AP的RSSI来计算出待测点的位置。
基于TOA的定位模型在开放的室外环境中非常有效,但在室内环境却存在一些问题。使用超声波虽可克服无线电波传输速度快的问题,但需构建专门的超声波系统。GPS也主要是针对户外目标设计的定位系统,应用于室内存在定位精度不高等问题。基于RSS的定位模型中,经验法需进行大量的实地测量,同时无法保护定位用户的隐私;而信号衰减法在室内受NLOS(非视距传播)等因素影响,也使得定位精度较低。
因此,本文提出了一种基于BP神经网络的室内定位模型并借助MATLAB 7.0加以实现。采用该方法进行室内定位,不需要WLAN以外的其他资源。由于不需要知道定位节点和建筑物的详细特性,用户的隐私将随之得到完全的保护。
2 基于BP神经网络的室内定位模型
BP神经网络通常是指基于误差反向传播算法(Backpropagation)的多层前向神经网络,目前,该算法已成为应用最为广泛的神经网络学习算法[4]。
BP神经网络采用的是并行网络结构,包括输入层、隐含层和输出层,经作用函数后,再把隐节点的输出信号传递到输出节点,最后给出输出结果。该算法的学习过程由信息的前向传播和误差的反向传播组成。在前向传播的过程中,输入信息从输入层经隐含层逐层处理,并传向输出层。第一层神经元的状态只影响下一层神经元的状态。如果在输出层得不到期望的输出结果,则转入反向传播,将误差信号(目标值与网络输出之差)沿原来的连接通道返回,通过修改各层神经元权值,使得误差均方最小。神经网络理论已经证明BP神经网络具有强大的非线性映射能力和泛化功能,任一连续函数或映射均可采用三层网络加以实现。
计算技术与自动化2007年6月第26卷第2期李 瑛等:一种基于BP神经网络的室内定位模型2.1 样本数据的采集和处理
输入向量为待测点收到的来自至少三个不同位置AP的RSSI值,输出向量为待测点的坐标值(X,Y)。
样本采集在一个10mX10m的室内场地中进行。使用3个来自SMC公司的AP和1台配置了ORiNOCO PC CARD的笔记本电脑。AP及无线网卡符合并工作在IEEE 802.11b标准下。笔记本电脑所使用的操作系统为RedHat Linux 9.0。样本均匀分布在6mx6m的中心区域中。
2.2 网络结构的确定
Kolmogorov定理已经证明[5],任意一连续函数可由一个三层BP 网络来实现。虽然研究表明三层以上的BP网络可以减少隐含层节点数,提高计算效率,但在缺乏理论指导的BP网络设计中这样做容易使问题趋向复杂化。因此选择三层BP神经网络,即只有1个隐含层的BP神经网络。
该网络输入层的节点数由输入向量的维数决定,输入向量的维数是3,所以输入层节点数确定为3个。输出层节点数由输出向量的维数决定,这里输出节点数为2 。
隐含层节点数的选择在BP网络设计中是一个难点,目前还没有理论上的指导。过多的网络节点会增加训练网络的时间,也会使网络的泛化能力减弱,网络的预测能力下降。然而网络节点过少则不能反映后续值与前驱值的相关关系,建模不充分。经反复试验,将隐含层节点数定为30,这样形成了一个3-30-2结构的BP神经网络,如图1所示。
2.3 学习算法的选择
基本BP 算法采用梯度下降法使得误差均方(mse)趋向最小,直至达到误差要求。但在实际应用中,存在收敛速度慢、局部极值等缺点。Matlab 7.0神经网络工具箱中提供了十多种快速学习算法,一类是采用启发式学习方法,如引入动量因子的traingdm 算法、变速率学习算法traingda 、“弹性”学习算法trainrp等;另一类采用数值优化方法,如共轭梯度学习算法traincgf 等。本研究选择traincgf 算法。该算法在不增加算法复杂性的前提下,可以提高收敛速度,并且可沿共扼方向达到全局最小点,较好地解决了经典BP算法所存在的收敛速度慢和可能出现局部最优解的问题。
2.4 BP神经网络的初始化、训练与仿真
1)建立网络
net==newff(P3,[30,2],{′tansig′,′purelin′},′traincgf′)
newff()为建立BP 神经网络的函数;P3为6维矩阵,表示3维输入向量中每维输入的最小值和最大值之间的范围。[30,2]表示隐层节点数是30,输出层节点数是2,{′tansig′,′purelin′}表示隐含层中的神经元采用tansig转换函数,输出层采用purelin函数,′traincgf′表示选择的学习算法。
2)权重和阈值初始化
net==init(net)
给各连接权重LW{1,1}、LW{2,1}及阈值b{1}、b{2}赋予(-1,+1)间的随机值。
3)训练
[net,tr]=train(net,P,T)
P为输入向量,T为目标向量,根据网络学习误差逆传递算法,利用阻尼最小二乘算法迭代,由前一次训练得到的网络权重及阈值训练得到新的网络权重及阈值。
为了使生成的BP网络对输入向量有一定的容错能力,最好的方法是既使用理想的信号又使用带有噪声的信号对网络进行训练。具体做法是先用理想的输入信号对网络进行训练,直到起平方和误差足够小;然后,使用20组理想信号和带有噪声的信号对网络进行训练。经过上述训练后,网络对无误差的信号也可能会采用对付带有噪声信号的办法,这样会导致很大的代价,因此,需要采用理想的向量对网络再次训练,以保证网络能对理想信号作出最好的反应。
使用函数traincgf对网络进行训练时,当网络平方和误差小于3时停止网络的训练。训练过程中的误差变化情况如图2所示。
根据训练后的网络及输入向量进行仿真输出。
3 实验结果及分析
利用训练后的BP神经网络进行了36次定位,并统计了36次定位的平均误差,结果如图3所示。
与利用信号衰减模型定位相比(如图4所示),利用BP神经网络定位具有更高的统计精度。
与信号衰减模型相比,虽然BP神经网络的模型解释直观性略有不足,但却可获得更精确的定位结果。
利用BP神经网络,虽然可解决传统处理方法所不能处理的非线性映射问题,但在实际应用中,对如何选择和确定一个合适的神经网络结构没有确切的理论指导,只能通过试验―调整―再试验的过程来确定一个合适的网络结构。同时,BP神经网络的隐含层作用机理和隐含层节点个数的选择是BP神经网络的难点问题。隐含层的节点个数的选择需反复进行试验,当多次输出结果在一定误差范围内时才可确定。
4 结束语
本文提出了一种基于BP神经网络的室内定位模型,并在基于IEEE 802.11b标准的WLAN环境中对此模型进行了测试。一个基于信号衰减模型的定位算法也在同样的环境中进行了测试。对比结果表明,利用BP神经网络进行室内定位能取得更好的定位精度。
关键词:无拖曳卫星;自适应控制;RBF神经网络;反步法
中图分类号:TP273文献标识码:A
Design of Adaptive Neural Network Controllers for LEO Dragfree Satellite
LI Ji,FAN Huijin
(School of Automation, Huazhong University of Science and Technology, Wuhan,Hubei 430074, China)
Abstract:Lowdisturbance environment can be achieved by the LEO(LowEarth Orbit) dragfree satellite, which benefits the validation of relativity, detection of gravitational waves and measurement of gravity field. For dragfree control purpose, most researches proposed controllers with linearized model and ignoring the nonlinear characteristics, which lower the accuracy of controllers. In this paper, by taking into account of the nonlinear characteristics, an adaptive neural network controller is established based on Lyapunov methods and adaptive backstepping control theory. For nonlinear characteristics and unmodeled dynamics, RBF neural network is employed for approximation. At the same time, we introduce the update laws of adaptive neural network weights, which guarantee the stability of the closedloop system and satisfy requirements of the dragfree satellite control system. The simulation results indicate that the controller is effective and the accuracy of the dragfree satellite can be satisfied.
Key words:Dragfree satellite;adaptive control;RBF neural network;backstepping
1 引 言
低轨卫星在太空飞行的过程中,承受着来自星际空间的各种扰动[1],例如,地球、太阳、月亮引力的影响,以及大气阻力、太阳辐射和地面反射等非惯性力的影响。然而相对论的验证、引力波探测以及地球重力场的测量等都需要低干扰试验环境。为了消除非惯性力的影响,文献[1]提出无拖曳(drag-free)技术,设计了无拖曳卫星:用一个质量块置于卫星本体内部,质量块将不受大气阻力等外部干扰力的影响,因为质量块不与卫星本体接触,所以几乎处于自由漂移状态,成为理想的宁静参考源。卫星本体保持与质量块之间相互隔离的状态,在适当传感器和控制算法条件下,从而保证卫星本体实现较高的宁静性[1]。
无拖曳卫星控制器不但可以使卫星保持稳定,而且良好的控制效果有助于航天任务的完成以及降低对硬件的要求,所以无拖曳卫星控制器设计一直是无拖曳卫星研究的重点。Stephan Theil[2-3]等人考虑了无拖曳卫星控制系统的不确定性,利用分散控制策略设计了系统的鲁棒控制器。E.Canuto[4-5]等人针对GOCE卫星,建立离散时间状态方程,利用嵌入式模型控制策略设计了可调控制器。文献[6]基于干扰观测模型,设计了混合H2/H
SymboleB@
最优控制器,并以LMI形式给出了求解控制器的条件并证明了控制器的稳定性。文献[7]针对卫星本体与质量块相对轨道动力学模型,采用卡尔曼滤波方法对状态和干扰进行了估计,并基于状态估计设计了最优控制器,有效地抑制了干扰对系统的影响。文献[8]基于H2优化理论设计了最优控制器,通过传递函数法及数值法双重分析表明所设计的控制器符合控制要求。
在这些已有的控制器设计中,大多未考虑系统的非线性环节或采用线性化方法,将系统简化为线性模型,从而降低了控制器的精度。由于无拖曳卫星控制系统本质上是一个复杂的非线性系统,本文将直接针对非线性模型,考虑到系统的非线性特征及未建模动态,利用神经网络对函数的有效逼近能力,对系统模型中的非线性部分进行拟合。首先,本文将无拖曳卫星控制系统根据控制目标划分为三个子系统:卫星本体与质量块相对位移子系统,即drag-free子系统;卫星本体姿态子系统;以及卫星本体与质量块相对姿态子系统。接着,针对每个二阶子系统,利用径向基函数(Radial Basis Function)神经网络对系统的非线性部分进行拟合,通过对基函数中心和方差进行学习,并采用自适应反步控制方法,设计相应控制器,建立神经网络权值自适应律以及分散自适应控制律。仿真结果验证了所设计的控制器的有效性。
计算技术与自动化2014年6月
第33卷第2期李 季等:低轨无拖曳卫星的自适应神经网络控制器设计
本文下面内容安排如下:第2节问题描述,建立无拖曳卫星的动力学模型;第3节针对drag-free控制回路、卫星本体姿态控制回路以及卫星本体与质量块相对姿态控制回路,分别设计控制器,同时给出了稳定性分析;第4节通过仿真证明所设计的控制器的有效性;第5节给出结论与进一步的工作。
2 问题描述
本文所考虑的低轨无拖曳卫星结构设计如下:无拖曳卫星只包含一个质量块,且形状为立方体,卫星内腔壁上的位置敏感器能够测量卫星本体和质量块的相对位置。这里采用静电位置悬浮及测量系统EPS(Electrostatic Positioning/Measurement System) 来测量质量块相对移动并对其施加静电力和力矩,根据EPS的测量结果,命令推进器输出相应的推力,使卫星本体跟踪质量块。推进器可以选择场发射推进器和微胶体推进器,它们具有极低的噪声干扰,而且可以实现极小的推力,非常适合无拖曳控制。但在近地环境中,大气阻力有时比较大,尤其在卫星的迎风面,此时需要采用推力较大的推进器,如离子推进器。所以在近地环境中,无拖曳控制往往采用了多种推进器组合的方式[1,8]。本文将无拖曳卫星控制系统根据控制目标划分为三个控制回路:卫星本体与质量块相对位移控制回路,即dragfree控制回路,卫星本体姿态控制回路以及卫星本体与质量块相对姿态控制回路,相关动力学方程如下[9]:
卫星本体与质量块相对位移动力学方程:
rel=1mtm(FGtm+FDtm+FSCtm)-
1msc(FGsc+FCsc+FDsc+FTMsc)-
2ωsc×rel-ωsc×(ωsc×(rh+rrel))-
sc×(rh+rrel)(1)
其中,rrel表示卫星本体和质量块的相对位移,rh表示敏感器空腔中心与卫星质心的距离,mtm表示质量块的质量,msc代表卫星本体的质量,ωsc表示卫星本体姿态角速度,FGtm、FGsc分别表示卫星本体和质量块受到的重力,FDtm、FDsc分别表示卫星本体和质量块受到的非惯性力,FCsc表示卫星本体受到的控制力,FSCtm、FTMsc表示卫星本体和质量块之间的耦合力。
卫星本体姿态动力学方程:
sc=I-1sc[TCsc+TDsc+TTMsc-ωsc×(Iscωsc)](2)
其中,ωsc表示卫星本体姿态角速度,Isc表示卫星本体的转动惯量,TCsc,TDsc,TTMsc分别表示卫星本体受到的控制力矩、干扰力矩和耦合力矩。
卫星本体和质量块的相对姿态动力学方程:
rel=tm-ATSsc+ωtm×ATSωsc=
I-1tm[TCtm+TDtm+TSCtm-
(ωrel+ωsc)×(Itm(ωrel+ωsc))]-
ATSsc-ATSωsc×ωrel(3)
其中,ωrel表示卫星本体和质量块的相对姿态角速度,ωtm表示质量块的姿态角速度,ωsc表示卫星本体姿态角速度,TCtm,TDtm,TSCtm分别表示质量块受到的控制力矩、干扰力矩和耦合力矩,ATS表示从卫星本体坐标系到质量块本体坐标系的旋转矩阵。
通常将质量块和卫星间的静电耦合基本模型看作一个弹簧―阻尼系统,以质量块为例,在敏感器坐标系下受到的耦合力和力矩形式如下:
FSCtm=-Ktransrrel-Dtransrel(4)
TSCtm=-Krotθrel-Drotrel (5)
其中,Ktrans为卫星本体和质量块之间的耦合水平弹性系数,Dtrans为水平阻尼系数,Krot为卫星本体和质量块之间的耦合旋转弹性系数,Drot为旋转阻尼系数。
通过线性化处理后,得到低轨无拖曳卫星控制系统的动力学简化模型如下:
rel=vrel
rel=-Ktransmtmrrel-Dtransmtmvrel-1mscFCsc+
f1(rrel,vrel
sc=ωsc
sc=I-1scTCsc+f2(φsc,ωsc)
rel=ωrel
rel=I-1tmKrotφrel+I-1tmDrotωrel+
I-1tmTCtm-I-1scTCsc+f3(φrel,ωrel)(6)
系统(6)中,φsc、ωsc分别表示卫星本体的姿态角和姿态角速度,rrel、vrel分别表示卫星本体和质量块的相对位移和相对运动速度,φrel、ωrel分别表示卫星本体和质量块的相对姿态角和相对姿态角速度。本文以欧拉角的形式给出了卫星本体和质量块的姿态。
f1(rrel,vrel),f2(φsc,ωsc),f3(φrel,ωrel)为未知光滑函数,代表系统的非线性特征、未建模动态及未知扰动。
注2.1与文献[9]相比,本文将扰动项1mscFDsc包含在了f1中,I-1scTDsc包含在了f2中,I-1tmTDtm、I-1scTDsc包含在了f3中,因此,文献[9]中所研究的模型是本文系统(6)的特例。
上述系统中所涉及的变量均为3维:包含x、y、z三个坐标轴方向。为了清晰地阐述本文的主要思想,以下将仅考虑单个坐标轴方向,并且假设变量之间以及坐标轴之间的交叉耦合量足够小。
定义x=[x11,x12,x21,x22,x31,x32]T,其中状态变量依次代表rrel、vrel、φsc、ωsc、φrel、ωrel。
系统(6)可写成如下三个子系统:
卫星本体与质量块相对位移子系统,即dragfree子系统:
Σ1:11=x1212=a1x11+b1x12+c1u1+f1(x11,x12)(7)
卫星本体姿态子系统:
Σ2:21=x2222=c2u2+f2(x21,x22)(8)
卫星本体与质量块相对姿态子系统:
Σ3:31=x3232=a2x31+b2x32-c2u2+c3u3+f3(x31,x32) (9)
其中,a1=-Ktransmtm,a2=I-1tmKrot,b1=-Dtransmtm,b2=I-1tmDrot,c1=-1msc,c2=I-1sc,c3=I-1tm,u1=FCsc,u2=TCsc,u3=TCtm。f1(x11,x12),f2(x21,x22),f3(x31,x32)代表系统的不确定性、未建模动态及未知扰动。
3 控制器设计
3.1 RBF神经网络
本文的目的是基于Lyapunov稳定性理论和自适应反步控制,对无拖曳卫星控制系统的非线性模型进行分析,设计一种自适应神经网络控制器。
人工神经网络形式多种多样,RBF神经网络是其中应用较为广泛的一种,表达形式如下[10-11]:
Ψ(X)=WTΦ(X) (10)
其中,W=[w1,w2,...,wl]T∈Rl为权重向量,Φ(x)=[φ1(X),φ2(X),...,φl(X)]T为基函数向量,l为隐含层神经元的个数,X=[x1,x2,...,xn]代表系统中的状态变量,并作为网络的训练样本输入。基函数i(X)选择高斯函数,表达式如下:
φi(X)=exp -X-ci22σ2i(11)
其中,ci=[ci1,ci2,...,cin]T是隐含层第i个径向基函数的中心点,n为输入层向量的维数,σi是径向基函数的宽度。
3.2 dragfree控制回路
3.2.1 控制器设计
系统Σ1表示dragfree控制回路:
Σ1:11=x1212=a1x11+b1x12+c1u1+f1(x11,x12)
f1(x11,x12)为未知光滑函数,由于RBF神经网络对于光滑函数的有效逼近能力,此时我们采用RBF神经网络对其进行拟合,表达式如下:
f1(x11,x12)=WT1Φ1(x11,x12) (12)
定义1为权值的估计值,1为权值的估计误差。即:
1=W1-1(13)
本节将采用RBF神经网络来对f1进行拟合,结合自适应反步控制,建立权重W1的自适应律,通过调节权重,可以达到系统自适应控制的目的。
第一步:考虑x11子系统,选择Lyapunov函数:
V11(x11)=12x211 (14)
对V11求导,得:
11=x1111=
x11x12(15)
将x12看成x11子系统的虚拟控制,令:
x12=z12+α11(x11)(16)
其中,z12为引入的新的虚拟控制,α11(x11)满足α11(0)=0,并选取为:
α11(x11)=-k11x11 (17)
其中,k11>0为可调参数。所以
11=x11(z12+α11(x11))=
-k11x211+x11z12(18)
第二步:考虑系统(x11,x12),选择Lyapunov函数:
V12(x12,x12)=V11(x11)+
12z212+12T1Γ11(19)
其中,Γ1为正定矩阵。
对V12求导,得:
12=-k11x211+x11z12+z1212+•T1Γ11=
-k11x211+z12(x11+12-α11x1111)+•T1Γ11=
-k11x211+z12(x11+a1x11+b1x12+
c1u1+WT1Φ1+k11x12)+•T1Γ11=
-k11x211+z12(x11+a1x11+b1x12+
c1u1+T1Φ1+k11x12)+z12T1Φ1+
•T1Γ11=
-k11x211+z12(x11+a1x11+b1x12+
c1u1+T1Φ1+k11x12)+(z12ΦT1+•T1Γ1)1 (20)
选取控制量为
u1=1c1(-x11-a1x11-b1x12-T1Φ1-
k11x12-k12z12) (21)
其中,k11>0,k12>0为可调参数。
权值自适应律1为
•1=z12Γ-T1Φ1=
(x12+k11x11)Γ-T1Φ1(22)
3.2.2 稳定性分析
定理 1[12] 考虑如下非线性系统
=f(x)
且
f(0)0 (23)
若存在具有连续1阶偏导数的标量函数V(x),满足以下条件:
1)V(x)是正定的;
2)(x)=dV(x)/dt是负定的;
3)当x
SymboleB@
时,V(x)
SymboleB@
。
则在系统原点处的平衡状态是大范围渐近稳定的。
通过上述控制器设计,由式(19),显然V12是正定的,又12=-k11x211-k12z212,由于k11,k12为大于零的可调参数,所以12是负定的,当x11
SymboleB@
,z12
SymboleB@
时,V12
SymboleB@
,所以x11,z12在平衡状态是大范围渐近稳定的。又由式(16)和式(17)可知,当t
SymboleB@
,x110,z120时,有x120,所以x11,x12在平衡状态是大范围渐近稳定的。
3.3 姿态控制回路
3.3.1 卫星本体姿态控制回路
卫星本体姿态状态方程如下:
Σ2:21=x2222=c2u2+f2(x21,x22)
f2(x21,x22)为未知光滑函数,我们采用RBF神经网络对其进行拟合,表达式如下:
f2(x21,x22)=WT2Φ2(x21,x22)(24)
定义2为权值的估计值,2为权值的估计误差。即:
2=W2-2(25)
本节将采用RBF神经网络来对f2进行拟合,结合自适应反步控制,建立权重W2的自适应律,通过调节权重,可以达到系统自适应控制的目的。
第一步:考虑x21子系统,选择Lyapunov函数:
V21(x21)=12x221(26)
对V21求导,得:
21=x2121=x21x22(27)
将x22看成x21子系统的虚拟控制,令:
x22=z22+α21(x21)(28)
其中,z22为引入的新的虚拟控制,α21(x21)满足α21(0)=0,并选取为:
α21(x21)=-k21x21(29)
其中,k21>0为可调参数。所以
21=x21(z22+α21(x21))=-k21x221+x21z22(30)
第二步:考虑系统(x21,x22),选择Lyapunov函数:
V22(x21,x22)=V21(x21)+
12z222+12T2Γ22(31)
其中,Γ2为正定矩阵。
对V22求导,得:
22=-k21x221+x21z22+z2222+•T2Γ22=
-k21x221+z22(x21+22-α21x2121)+•T2Γ22=
-k21x221+z22(x21+c2u2+WT2Φ2+
k21x22)+•T2Γ22=
-k21x221+z22(x21+c2u2+T2Φ2+
k21x22)+z22T2Φ2+•T2Γ22=
-k21x221+z22(x21+c2u2+T2Φ2+
k21x22)+(z22ΦT2+•T2Γ2)2 (32)
选取控制量为
u2=1c2(-x21-T2Φ2-
k21x22-k22z22) (33)
其中,k21>0,k22>0为可调参数。
权值自适应律2为
•2=z22Γ-T2Φ2=(x22+k21x21)Γ-T2Φ2 (34)
3.3.2 卫星本体与质量块相对姿态控制回路
卫星本体与质量块相对姿态状态方程如下:
Σ3:31=x3232=a2x31+b2x32-c2u2+c3u3+f3(x31,x32)
f3(x31,x32)为未知光滑函数,我们采用RBF神经网络对其进行拟合,表达式如下:
f3(x31,x32)=WT3Φ3(x31,x32) (35)
定义3为权值的估计值,3为权值的估计误差。即:
3=W3-3(36)
本节将采用RBF神经网络来对f3进行拟合,结合自适应反步控制,建立权重W3的自适应律,通过调节权重,可以达到系统自适应控制的目的。
第一步:考虑x31子系统,选择Lyapunov函数:
V31(x31)=12x231 (37)
对V31求导,得:
31=x3131=x31x32(38)
将x32看成x31子系统的虚拟控制,令:
x32=z32+α31(x31)(39)
其中,z32为引入的新的虚拟控制,α31(x31)满足α31(0)=0,并选取为:
α31(x31)=-k31x31 (40)
其中,k31>0为可调参数。所以
31=x31(z32+α31(x31))=-k31x231+x31z32(41)
第二步:考虑系统(x31,x32),选择Lyapunov函数:
V32(x31,x32)=V31(x31)+
12z232+12T3Γ33(42)
其中,Γ3为正定矩阵。
对V32求导,得:
32=-k31x231+x31z32+z3232+•T3Γ33=
-k31x231+z32(x31+32-α31x3131)+•T3Γ33=
-k31x231+z32(x31+a2x31+b2x32-c2u2+
c3u3+WT3Φ3+k31x32)+•T3Γ33=
-k31x231+z32(x31+a2x31+b2x32-c2u2+
c3u3+T3Φ3+k31x32)+z32T3Φ3+
•T3Γ33=
-k31x231+z32(x31+a2x31+b2x32-c2u2+
c3u3+T3Φ3+k31x32)+(z32ΦT3+•T3Γ3)3 (43)
选取控制量为
u3=1c3(-x31-a2x31-b2x32+c2u2-
T3Φ3-k31x32-k32z32)(44)
其中,k31>0,k32>0为可调参数。
权值自适应律3为
•3=z32Γ-T3Φ3=(x32+k31x31)Γ-T3Φ3(45)
3.3.3 稳定性分析
由定理1,对于子系统Σ2,由式(31),显然V22是正定的,又22=-k21x221-k22z222,由于k21,k22为大于零的可调参数,所以22是负定的,当x21
SymboleB@
,z22
SymboleB@
时,V22
SymboleB@
,所以x21,z22在平衡状态是大范围渐近稳定的。又由式(28)和式(29)可知,当t
SymboleB@
,x210,z220时,有x220,所以x21,x22在平衡状态是大范围渐近稳定的。同理可得,x31,x32在平衡状态是大范围渐近稳定的。
4 仿真分析
本节为了证实所提出的控制器的有效性,在matlab/simulink环境下进行了仿真验证。
仿真参数如下[9]:卫星本体质量为1050 kg,质量块质量为1 kg,卫星本体和质量块之间的初始相对距离为rrel=1×10-3m,卫星本体和质量块之间的初始相对姿态为φrel=1•π/180rad,卫星本体和质量块之间的耦合水平弹性系数Ktrans=1×10-6N/m,水平阻尼系数Dtrans=1.4×10-11N/m2,卫星本体和质量块之间的耦合旋转弹性系数Krot=1×10-9N•m/rad,旋转阻尼系数Drot=3.3×10-14N/rad,卫星本体的转动惯量Isc=200kg•m2,质量块的转动惯量Itm=2.667×10-4kg•m2。
仿真结果如图1―图3所示。
图1 卫星本体与质量块的相对位移
图2 卫星本体的姿态
从图1中可以看出,在含有不确定的情况下,通过设计的控制器,卫星本体与质量块的相对位移最终趋于零,说明卫星本体能够很好的跟踪质量块,达到dragfree控制的要求,并且精度在10-6数量级,满足dragfree控制的精度需求。图2~图3给出了卫星本体的姿态以及卫星本体与质量块的相对姿态及其控制精度,仿真结果很好的满足了卫星本体与质量块姿态的一致性。
图3 卫星本体与质量块的相对姿态
5 结 论
本文针对无拖曳卫星控制系统,考虑到系统的不确定性、未建模动态以及外界的未知扰动,采用神经网络的方法进行补偿,基于Lyapunov 稳定性理论,结合自适应反步控制,得到权值的更新律以及相应的控制器。仿真结果表明,所设计的控制器有效地抑制了不确定对控制系统的影响。
与传统卫星控制系统相比,无拖曳卫星对控制系统提出了极高的性能指标要求,下一步将考虑存在耦合时,卫星模型的建立和控制器的设计。
参考文献
[1] 施梨,曹喜滨,张锦绣,等. 无阻力卫星发展现状[J]. 宇航学报, 2010,31(6):1511-1520.
[2] PETTAZZI L, LANZON A,THEILS. Design of Robust Decentralized Controllers for Dragfree Satellite[C].Proc.47th IEEE conf. Decision and Control, 2008:602-607.
[3] PETTAZZI A,LANZON A,THEIL S. Design of Robust Drag-Free Controllers with Given Structure[J]. GUIDANCE, CONTROL, AND DYNAMICS, 2009,32(5):1609=1620.
[4] ANDREIS D,CANUTO E. DragFree and Attitude Control for the GOCE satellite[C].Proc.44th IEEE conf. Decision and Control, 2005:4041-4046.
[5] CANUTO E,BONA B,CALAFIORE BM. Indri. Dragfree control for the European satellite GOCE. Part I:modelling[C].Proc.41th IEEE conf. Decision andControl, 2002:1269-1274.
[6] 曹喜滨,施梨,董晓光,等. 基于干扰观测的无阻力卫星控制器设计[J].宇航学报, 2012,33(4):411-418.
[7] 李传江,王玉爽,马广富,等. 带卡尔曼估计器的无拖曳卫星干扰补偿控制[J].哈尔滨工业大学学报, 2012,44(7):8-13.
[8] 李洪银,胡明. 单测试质量无拖曳卫星无拖曳及姿态系统仿真及其控制研究[J].天文学报, 2011,52(6):525-536.
[9] 王玉爽. 无拖曳卫星控制方法研究[D]. 哈尔滨:哈尔滨工业大学, 2011.
[10]宋申民,于志刚,段广仁. BTT导弹自适应神经网络控制[J].宇航学报, 2007,28(5):1224-1230.
关键词: 正交基神经网络; 非线性; 卫星信道; 预失真
中图分类号: TN927?34 文献标识码: A 文章编号: 1004?373X(2013)09?0040?03
0 引 言
高功率放大器是卫星通信系统中的重要组成部分,当其工作在饱和区附近时,卫星信道具有严重的非线性。这种非线性对信号的影响主要有两方面[1]:一是信号星座图发生变形,造成码间串扰(ISI);二是频谱再生,引起邻近信道干扰(ICI)。
随着现代通信技术和多媒体业务的高速发展,大容量高速率的信息传输十分必要,卫星通信也以不可抵挡之势向高速率大容量的方向迅猛发展。由于通信速率和通信带宽的迅猛增加,频谱资源越来越紧张,现代卫星通信更趋向于采用比恒包络调制频谱效率更高的幅度相位联合调制方式,如DVB?S2标准中的APSK等调制方式[2?3]。与传统的相位调制技术相比,APSK信号由于其信号幅度的变化,对卫星信道的非线性失真更加敏感。为保证通信性能,必须对信道的非线性失真进行补偿。
1 高功放的非线性特性及其对系统性能的影响
高功放的工作特性分为线性区和非线性区,当输入信号功率较低时,输出和输入功率关系是线性的;当输入功率较高时,输出和输入功率关系呈现出非线性,当输出功率达到饱和,再增加输入功率,输出功率不会增大还可能会减小。
高功放非线性模型非常多,本文采用经典的Saleh模型,该模型中幅度和相位的输出仅与输入信号的幅度有关。其幅度和相位转移特性曲线如图1所示,当输入信号归一化幅度小于0.6时,幅度转移和相位转移呈现线性,大于0.6时,其转移特性呈现非线性。
图2为16APSK信号经过非线性高功放的收发信号星座图。可以看出,接收信号星座图已经发生严重畸变,外圈星座点半径被压缩,内圈星座点半径扩大,内外圈星座点欧式距离被缩小;星座点相对原来位置发生逆时针旋转;码间串扰很大,星座点扭曲严重。由于高功放非线性效应的影响,在不加补偿的情况下,接收机已经不能正常工作。
2 正交基神经网络
正交基前向神经网络模型如图3所示。该网络模型由输入层、隐藏层和输出层组成。其中输入层、输出层各有一个神经元,使用线性激励函数[f(x)=x],隐藏层有[n]个神经元,采用一组阶次逐渐增高的正交多项式[φ(x)]作为其激励函数。
传统的神经网络存在收敛速率慢和易陷入局部极小等缺点,文献[4]提出了一种Chebyshev正交基神经网络,该网络的隐藏层神经元采用Chebyshev正交多项式,即文献[4]采用基于伪逆的方法,实现了一步权值直接确定,不需要迭代,具有更高的计算速率和工作精度,同时不存在局部极小的问题。考虑到Chebyshev正交基神经网络的优点,将其应用到卫星非线性信道的补偿技术中。
3 基于正交基神经网络的预失真补偿算法
正交神经网络预失真系统框图如图4所示。[x(n)]为预失真器的输入,[y(n)]为预失真器的输出、高功放的输入,[z(n)]为高功放的输出,用[M(?)]和[N(?)]分别表示预失真器的幅度和相位转移特性,预失真器的输入输出关系为[1]: