时间:2023-08-01 16:55:48
序论:在您撰写光谱学与光谱学分析时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
英文名称:Spectroscopy and Spectral Analysis
主管单位:中国科学技术协会
主办单位:中国光学学会
出版周期:月刊
出版地址:北京市
语
种:中文
开
本:大16开
国际刊号:1000-0593
国内刊号:11-2200/O4
邮发代号:82-68
发行范围:国内外统一发行
创刊时间:1981
期刊收录:
CA 化学文摘(美)(2009)
SA 科学文摘(英)(2009)
SCI 科学引文索引(美)(2009)
CBST 科学技术文献速报(日)(2009)
Pж(AJ) 文摘杂志(俄)(2009)
EI 工程索引(美)(2009)
中国科学引文数据库(CSCD―2008)
核心期刊:
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
中文核心期刊(1996)
中文核心期刊(1992)
期刊荣誉:
联系方式
期刊简介
关键词:关注度; 支持向量机; 期望最大化; 主动学习; 高光谱遥感图像
中图分类号:TP391.41 文献标志码:A
0引言
遥感图像分类在现实生活中有着非常广泛的应用,如地质勘探与地球资源调查、城市遥感与规划管理、环境与灾害监测、现代精细农业、测绘以及考古等遥感图像精准分类是诸多应用的基础问题,同时也是热点问题近十几年,卫星传感器技术得到了不断发展,遥感图像的光谱和空间分辨率不断提高,目前较为流行的高光谱成像系统包括AVIRIS、HYDICE、ARCHER、HYMAP和HYPERION通过这些成像系统获取的遥感图像所蕴含的信息得到了极大丰富,这为高光谱图像分类和聚类分析提供了新的契机,目前国内外学者提出了很多相关算法和方法,几乎所有经典的机器学习方法都被应用到图像分类和聚类分析中分类方面诸如基于最大似然和贝叶斯估计的方法[1]、基于核和决策树的方法[2]、基于图的方法[3],而在基于核的方法[4]中,支持向量机(Support Vector Machine,SVM)在分类中的表现较为突出;聚类方面的大多数方法都是通过像元之间的相似性,利用统计学方法对图像进行聚合[5]但是,单一使用分类或者聚类方法无法充分利用图像中所包含的光谱和空间信息,所以在文献[6]中使用监督分类方法初始化聚类分割区域的标签,再通过流域变换获取最优的分割图像,最终在分割区域内对分类图像的结果标签进行投票,分割区域将标记为投票最高的类别,其分类的最终结果优于单一的分类或聚类方法文献[7]用投票的方式对聚类结果和分类结果进行整合,最终使用分类所得的标签投票决定分割区域的类别,然后再对结果进行降噪处理,其最终精确度也比传统方法高但是,这两种方法都需要使用大量的训练样本来构造分类器,分类成本都比较高为了减少分类器对训练样本数量的需求,提高训练样本质量成为首要问题近几年,主动学习方法在寻找包含信息量较大、质量较高的训练样本时表现突出[8]
本文提出一种基于主动学习的高光谱图像分类(Hyperspectral Image Classification based on Active Learning, HICAL)方法,关注如何在减少训练集数量的同时提高分类精确度,结合了分类和聚类方法,充分利用高光谱图像的光谱和原始空间特征,找到信息量较大的分割区域,进而获取信息价值较高的训练样本,最终有效提高分类器的分类效果
1基于主动学习的高光谱图像分类方法
1.1问题描述
为了尽可能地降低高光谱图像分类精确度和所需的训练样本数量的比例,一方面需要充分利用高光谱图像所蕴含的信息,另一方面需要提高训练样本的质量
HICAL方法是以分类和聚类结果结合后所构建的框架为基础,使用本文提出的关注度计算方法对结合后的区域进行统计,以找到信息量较高的区域新的训练样本将在关注度较大的区域中产生,以此来提高训练集的质量
1.2HICAL方法
1.2.1聚类分析
本文使用期望最大化(ExpectationMaximization,EM)算法对高光谱图像进行聚类分析在统计计算中,EM是在概率模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量在使用EM算法过程中,可以假设所有的样本都是符合高斯分布
EM算法对图像进行聚类过程中,为了使算法尽快收敛,将高光谱图像的光谱波段进行分组求均值,以此来减少参与计算的光谱波段数量聚类所得到的分割图像通过四联通的方式进行区域划分,并且给这些区域唯一标号得到的带有标号的区域分割图将作为模板,在后续迭代过程中与分类结果进行整合
1.2.2监督分类
获取聚类结果之后,需要对图像进行监督分类本文在分类过程中使用支持向量机(SVM)方法SVM是目前监督分类使用较多的分类算法,是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,具有较好的泛化能力和学习能力
二分的支持向量机最终目标是找到一个(d-1) 维的决策面,将测试样本分成两类在使用SVM进行图像分类时,总是将像元的特征通过一个核函数映射到一个较高维度的空间,这样使样本的区分度更大,通常使用高斯核函数(Radial Basis Function,RBF)
在二分问题中,通常将决策函数表示如下:
其中:SV表示得到的支持向量集合,对应的αi不等于0
使用SVM对多类问题进行分类时,通常采取两种策略一种是一对一(OneAgainstOne,OAO)的方式,另一种是一对多的方式(OneAgainstAll,OAA),本文采用OAO的方式
HICAL方法在第一次监督分类过程中,需要少许的训练样本,通过SVM构造分类器,且监督分类的步骤在整个分类过程中是迭代进行的,每当新的训练样本被增加到训练集时,都会重新构造分类器,对图像进行新一轮分类
1.2.3整合聚类和分类结果
在获取聚类和监督分类结果后,借鉴文献[7]中方法对两个结果进行整合,以聚类连通区域为模型对监督分类结果进行区域划分,并给出标号最终在整合结果中的每一个区域内,都包含一个或一个以上的像元,这些像元分类标记的类别可能比较集中,也可能比较分散,这些分类标记主要取决于监督分类器的预测
1.2.4获取新样本来源区域
获取整合结果之后,需要在结果所包含的区域中找到包含信息量较大的区域实验中总是更为关注那些含有较多像元,且分类标签比较分散的区域这样的区域如果分类准确度较高,将会很大程度地提高总体分类精确度因此,对区域的关注度给出如下公式定义:
其中:b为区域i包含像元个数ni的权重基数,用户可根据情况自己选择;t为迭代抽样的次数,其意义是,随着迭代的进行,在较大区域已经得到关注和抽样之后,对于这些区域的关注度将会不断下降,这样在防止大区域过分取样的同时,可以很好地兼顾到小样本区域,所以,可以很好地解决以往算法对小样本区域分类精确度不高的难题
获取不同区域的关注度值之后,为了更集中、更有效地提高请求询问的训练样本的质量,将通过设定阈值来选取需要取样的区域最终在t次迭代中将选取满足如下条件的区域作为新训练样本的来源区域:
1.2.5新样本选择
获取样本来源区域后,可以定义迭代中所需新样本的数量Ut对来源区域j∈Γt的取样数量可以表示为μj,且满足μj≥0在来源区域取样的方式有两种:S0和S1,其中S0是按照随机方式在来源区域中选择,而S1是根据来源区域中找到上一次监督分类器标记的最多标签类和次多标签类的子区域,按照两个子区域的样本比例进行抽取
1.2.6主动学习过程
本文的HICAL方法迭代过程通过主动学习方式来实现整个过程分为两个阶段:1)初始化分类器阶段,即初始监督分类阶段,在此阶段首先需要提供少量的训练集,训练初始分类器;2)循环取样阶段,也是主动学习的主要阶段,这个阶段在未标记样本中使用关注度进行查询,获取信息量较大的整合区域,从而进一步找到需要标注的样本,标注之后追加到原有的训练集中,重新对分类器进行训练,这个过程不断循环,直到达到停止条件这个停止条件可以有多种,比如新训练样本数量达到上限,或者是已经达到迭代取样的次数等
迭代结束后,将最后一次迭代所产生的分类结果和初始的聚类结果,按照聚类区域为模板,对所有分类产生的标签进行投票,区域内所有的像元将归属到得票最高的标签类最后进行降噪处理
2实验及分析
2.1实验环境
本文实验环境:中央处理器Intel Core Duo P7350 2.00GHz,内存2GB,32位Windows 7操作系统;软件平台为Matlab R2012a
2.2实验数据集
高光谱图像分类实验使用的是印第安纳州农林区域图像数据集(Indian Pines)
印第安纳州农林区域图像拍摄于1992年,使用红外成像光谱仪(AVIRIS)获取,其内容是印第安纳州西北区域的某一农业森林区的地表信息整幅图像包含145×145像元,空间分辨率为20m,有220个波段,其中20个水吸收波段将在实验前被除去图像反映了16种不同的地物信息图1(a)显示这个高光谱数据的假彩色图像;图1(b)显示了其真实的地物信息,不同的颜色代表不同的类别本次实验针对的感兴趣区域总共有10366个样本,过去相关文献中多数是在每一类别中随机抽取10%的样本作为训练样本,这样的抽样方式对样本比较少的类别来说是非常不利的为了和传统的分类方式对比,在实验中也将采取这样的抽样方式,但抽样的百分比会降低
2.3实验过程和结果分析
2.3.1HICAL方法与传统随机取样方法比较
本实验将本文的HICAL方法与传统随机取样方法进行对比表1中显示了各个算法的整体分类精确度(Overall Accuracy,OA)、平均分类精确度(Average Accuracy,AA)、Kappa系数以及每种地物的分类精确度SVM和SVM+EM算法[7]是在每一个类别中随机抽取10%的样本(1029个)作为训练集,其中SVM+EM也是结合光谱和空间特征的分类方法作为对比,本文算法将在每类随机抽取4%的训练样本(407个)上进行
通过式(2)计算出每一个分割区域的关注度值,这样就可以选出一些关注度较高的区域作为新训练样本来源区域实验中取γt=0.15,每一次迭代对样本的抽取数量做出限定,为了和传统的方法比较,实验中只进行4次迭代,每次迭代取样本数Ut=50分别使用S0和S1方法对新样本来源区域进行取样(如表1所示)
迭代起始阶段,大样本区域的关注度值会比较高,这样在开始的迭代过程中可以有部分提高分类器的分类准确度,迭代后期,关注的重心转向区域较小的分割区从表1中可以看到,在迭代4次后,训练样本总数为607,远小于随机抽取10%的1029,但Alfalfa、Grass/pasturemowed和Oats三个小样本区域的分类精确度已经得到了非常显著的提高这说明HICAL方法可以有效地解决这种小样本区域的分类难题,最终获取的分类结果无论是整体分类精确度还是平均分类精确度都得到了明显提高(如表1)
2.3.2HICAL方法和相关主动学习方法比较
本实验将HICAL方法和目前较新的且表现优秀的主动学习方法进行比较[9]实验中,初始化分类器时需要80个训练样本(每一类别5个),每一次迭代都将获取50个新样本标注为训练集,同时设定每一次迭代的阈值都为γt=015在初始取样方法和所获得的训练样本总数都相等的情况下,LORSALALMLL、MPMLBPAL两种算法使用四种不同的方式迭代获取训练样本:RS(Random Selection)、MI(Mutual Information)、BT(Breaking Ties)、MBT(Modified Breaking Ties)表2中给出了这些不同方法获取的分类结果可以看出,本文提出的方法在总体分类精度上更为出色
3结语
本文提出了一种基于主动学习的高光谱图像分类方法HICAL,能够充分利用图像的光谱特征和原始空间特征,同时使用一种新的高效的区域关注度计算方法对结合区进行统计,根据统计后的数值能够非常精确地找到信息量价值较高的区域,进而获取质量较高的未标记样本以此提高整体训练集的质量,在训练样本较少的情况下能够有效提高整体分类精确度和平均分类精确度,从而降低分类精确度和训练样本数量的比值
本文方法在分类过程中较之传统的分类方法更能解决样本失衡的问题,能够有效地解决小样本区域的分类难题;同时文中所提出的分类方法扩展性较强,在分类和聚类算法的选择上比较宽松,可以使用诸如K均值、自组织迭代技术等算法进行替代在HICAL方法迭代过程中,关注度阈值的选取和样本数量的设置,以及对区域样本的选择方法将是我们进一步研究的内容;同时我们也将关注其他分类和聚类算法,以期减少算法的时间复杂度
参考文献:
[1]LANDGREBE D A. Signal theory methods in multispectral remote sensing [M] . New York: Wiley, 2003.
[2]MOUSTAKIDIS S, MALLINIS G, KOUTSIAS N, et al. SVMbased fuzzy decision trees for classification of high spatial resolution remote sensing images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2012,50(1):149-169.
[3]BAI J, XIANG S M, PAN C H. A graphbased classification method for hyperspectral images [J]. IEEE Transactions on Geoscience and Remote Sensing, 2013,51(2):803-817.
[4]LI CH, KUO BC, LIN CT, et al. A spatial contextual support vector machine for remotely sensed image classification [J]. IEEE Transactions on Geoscience and Remote Sensing, 2012,50(3):784-799.
[5]MAULIK U, SAHA I. Modified differential evolution based fuzzy clustering for pixel classification in remote sensing imagery [J]. Pattern Recognition, 2009,42(9):2135-2149.
[6]TARABALKA Y, CHANUSSOT J, BENEDIKTSSON J A. Segmentation and classification of hyperspectral images using watershed transformation [J]. Pattern Recognition, 2010,43(7):2367-2379.
[7]TARABALKA Y, BENEDIKTSSON J A, CHANUSSOT J. Spectralspatial classification of hyperspectral imagery based on partitional clustering techniques [J]. IEEE Transactions on Geoscience and Remote Sensing, 2009,47(8):2973-2987.
1.1样品收集及制备
收集不同种植区域、不同品种、不同部位的单料烟样品共110个。将样品放入烘箱内,40℃排气烘烤2h,然后磨碎过40目筛,控制含水率在6%~10%之间。
1.2试验仪器及软件
仪器:Antaris傅里叶变换近红外光谱仪(美国ThermoNicolet公司);Agilent7890-5975气相色谱质谱仪(美国Agi-lent公司);AG204型电子天平(感量0.1mg,瑞士梅特勒-托利多公司);GFL3020震荡器(德国GFL公司);电热恒温水浴锅(德国GFL公司);VELPDK20消化器(意大利VELP公司);连续流动分析仪(美国Astoria-Pacific公司);旋转粉碎机(北京高科公司);恒温箱(日本ESPEC);SDE蒸馏器(郑州玻璃仪器厂);可控温度电热套及恒温水浴锅。软件:TQAnalyst8数据分析软件(美国ThermoNicolet公司);SPSS13.0统计产品与服务解决方案(美国IBM公司)。
1.3近红外光谱扫描
取适量烟末装入石英杯中,用500g的压样器压平杯中样品后,放到光谱仪器台上扫描。仪器的工作参数:光谱范围3800~10000cm-1,间隔4cm-1,分辨率8cm-1,扫描次数69次。
1.4常规化学成分的测定
参照烟草行业标准规定的方法应用连续流动分析仪测定样品的总糖、还原糖、烟碱、总氮、氯、钾含量,并计算出相应的糖碱比和钾氯比[11]。
1.5挥发性香味成分分析
采用同时蒸馏萃取的方式提取样品中的挥发性香味成分,具体操作如下:样品称质量25g,加水300mL、二氯甲烷60mL,同时蒸馏萃取2.5h,浓缩后加内标乙酸苯乙酯(12.553g/L)10μL后待测。采用安捷伦7890-5975NGC-MS分析,色谱柱HP-5(30m×250μm×0.25μm),进样口温度250℃,流速1mL/min,分流比10∶1。起始温度60℃,以5℃/min升温到80℃,保持5min;以2℃/min升温到150℃,保持10min;以2℃/min升温到200℃,保持20min;以2℃/min升温到280℃,保持10min,总运行时间149min。共检测到挥发性香味成分33种。
1.6逐步判别分析
逐步判别分析是一种多元统计方法。整个变量筛选过程实质就是作假设检验,通过检验引入显著性变量,剔除不显著变量。反映在输出结果上,通常可以用F值的大小作为变量引入模型的标准,即一个变量是否能进入模型主要取决于协方差分析的F检验的显著水平。逐步判别过程本身并不建立判别函数,筛选出重要变量后,采用Bayes判别方法建立判别函数和判别准则,对新样品进行判别归类。
2结果与分析
2.1近红外谱图的处理
2.1.1谱图的预处理
烟草样品的近红外谱图会受到样品颜色及仪器稳定性的影响而出现噪音及基线漂移,所以必须对样品的近红外谱图进行前处理[6]。利用TQAnalyst8分析软件包中的优化功能,采用如下方法可获得理想的结果:多元散射校正消除样品不均匀带来的差异;采用段长为9、间隔为5的NorrisDerivative滤波平滑光谱,消除高频噪音,保留有用的低频信息;采用二介微分处理,消除基线漂移的影响,获得比原光谱更高分辨率和更清晰的光谱轮廓变化。
2.1.2谱图的主成分分析
选择4000~8000cm-1波数为分析区域,由主成分分析获得样品的10个主成分,前5个主成分的贡献率达到96.97%,即5个主成分就能够代表96.97%的近红外谱图信息,所以以5个主成分得分为分析对象,采用逐步判别分析进行模式识别。
2.2烟叶种植区域模式识别结果的比较
收集的样品由福建、云南、安徽、江西、贵州4个地区的烟叶样品组成,依据《中国烟草种植区划》[13]110个样品属于5个产区,从每个产区随机抽取5个作为外部验证样品,其余作为建模样品。通过逐步判别分析,筛选出对于种植区域判别有主要影响作用的6种化学成分,即糠醛、吲哚、香叶基丙酮、柏木醇、新植二烯和氯,并获得其Bayes判别函数,同样由逐步判别分析获得近红外光谱5个主成分得分烟叶种植区域的Bayes判别函数。将筛选出的变量代入Bayes判别函数计算得到判别值,比较各判别值大小,其中最大值所对应的分组便是判别分组。表2表明,化学成分建模85个样品种植区域交叉验证模式识别的准确率为91.76%,外部验证25个样品种植区域模式识别的准确率为80.00%;近红外光谱建模85个样品种植区域交叉验证模式识别的准确率为89.41%,外部验证25个样品种植区域模式识别的准确率为80.00%。种植区域化学成分模式识别的准确率略高于近红外谱图模式识别的结果。滇南桂西山地丘陵烤烟区及滇西高原山地烤烟烟区都属于云南地区,地理位置较近,且种植水平及习惯接近,因此2个地区的样品发生部分误判,闽西赣南粤东丘陵烟区、皖南赣北丘陵烤烟区、黔中高原山地烤烟区样品识别正确率较高(表2)。
2.3烟叶品种模式识别结果的比较
收集的110个烟叶样品共有云烟87、翠碧1号、K326、红花大金元等4个品种,从每个品种中随机抽取5个作为外部验证样品,其余的样品作为建模样品。通过判别分析,筛选出对于品种模式识别有主要影响的4种化学成分,即4-环戊烯-1,3-二酮、茶香酮、香叶基丙酮、氯,并获得了其Bayes判别函数,同样由逐步判别分析获得近红外光谱5个主成分得分烟叶品种的Bayes判别函数。目前我国主栽烤烟品种均直接或间接来自于相同的亲本,甚至有些品种间亲缘关系极近,致使品种鉴别时容易发生错判。表4结果表明,化学成分建模90个样品品种交叉验证模式识别的准确率为77.78%,外部验证20个样品品种模式识别的准确率为70.00%;近红外光谱建模90个样品品种交叉验证模式识别的准确率为82.22%,外部验证20个样品品种模式识别的准确率为75.00%。烟草品种的近红外谱图模式识别结果优于化学成分模式识别的结果。
2.4烟叶部位模式识别结果的比较
收集的110个烟叶样品中上部烟36个、中部烟38个、下部烟36个,从不同部位的烟叶样品中随机抽取8个样品外部验证样品,其余的样品作为建模样品。通过判别分析,筛选出对于烟叶部位模式识别有主要影响的化学成分为三环萜、柏木醇、总烟碱,并获得了其Bayes判别函数,同样由逐步判别分析获得近红外光谱5个主成分得分烟叶部位的Bayes判别函数。表6结果表明,化学成分建模86个烟叶样品部位交叉验证模式识别的准确率为86.05%,外部验证24个烟叶样品的准确率为75.00%,近红外光谱建模86个烟叶样品部位交叉验证模式识别的准确率为94.19%,外部验证24个烟叶样品的准确率为91.67%。烟叶部位的近红外谱图模式识别结果优于化学成分模式识别的结果。
2.5模式识别结果比较
以化学成分、近红外光谱建模样品及外部验证样品模式识别正确识别的个数为变量进行相关性分析及配对t检验。相关性分析结果表明,2种方式获得的结果都存在显著的相关性(P<0.05);配对t检验结果表明所获得的结果差异不显著(P>0.05)(表7)。
3结论
【摘要】 目的采用气相色谱-质谱联用(GC-MS)分析广西余甘子叶挥发油的成分。方法采用维普(HP-5MS)弹性石英毛细管柱,程序升温,以EI离子源和四极杆质量分析器进行分析,质谱图用NIST98谱库检索,结合人工谱图解析,鉴定各种成分,并用色谱峰面积归一法测定其相对百分含量。结果分离出29个色谱峰,鉴定出26种成分,占已分离组分总含量的90%以上。其中叶绿醇(19.00% ) 、2,4-二叔丁基苯酚 (18.79% )和异植物醇 (10.54% ) 为所含的相对含量较高的成分。结论该法简便、快速、灵敏度高。
【关键词】 余甘子叶 气相色谱-质谱联用 成分分析
余甘子叶,来源于大戟科叶下珠属植物余甘子Phyllanthus emblical L.的叶子,收载于1974年出版的《云南省药品标准》、1978年版《藏药标准》、1977~2005年版《中华人民共和国药典》。别名橄榄、滇橄榄 、油甘子、山油甘、庵摩勒、牛甘子、喉甘子、杨甘等,为多个民族习用药[1],广泛分布于世界上许多国家。我国对余甘子的栽培利用有1800年以上的悠久历史,该植物主要分布于我国的云南、四川、福建、广东、广西等地,是一种具有较高的食用和药用价值的植物果实,被联合国卫生组织指定为在全世界推广种植的3种保健植物之一。主治血病、赤巴病、培根病、肝病、心脏病和高血压病,以治疗血热血瘀引起的血病为长。近年研究表明余甘子具有抗菌[2]、抗肿瘤[3]、抗氧化[4]、抗动脉粥样硬化[5,6]、抗乙肝病毒[7]、保肝[8]等作用。国内学者对余甘子果实的化学成分进行了较多的报道,但余甘子叶的化学成分研究未见报道,而余甘子叶含有较浓的芳香气,本实验提取了挥发油,进行了定性定量分析。
1 仪器与材料
美国 HP 6890/5973N气相色谱质谱联用仪(美国安捷伦),HP-5MS弹性石英毛细管柱 (30 mm ×0. 25 mm,0. 25 μm);G1701DA MSD化学工作站。相关试剂为分析纯;余甘子叶采自广西地区,经广西中医学院刘寿养副教授鉴定为广西产的大戟科叶下珠属植物余甘子Phyllanthusemblica L.的全草。标本存于广西中医学院药学中心实验室。
2 方法
2.1 余甘子叶挥发油的提取取60 g新鲜余甘子叶,捣碎,放进1 000 ml圆底烧瓶中,用挥发油提取器按常规水蒸气蒸馏法提取挥发油,经无水Na2SO4 干燥后得淡黄绿色挥发油,收油率为0.2%。
2.2 气相-质谱分析条件气相色谱条件:进样口温度250℃,载气:氦气,流速1 ml·min- 1。柱温:程序升温70~280℃,初始温度 70℃,保留3min,升温速率10℃/min,终止温度 100 ℃,以5. 0℃/min升温至120℃后,再以30℃/min,升温至220℃后,以20 ℃/min升温至280℃,溶剂延迟1. 0 min;进样量1.0 μl,不分流。
质谱条件:EI电离方式,离子源温度 230℃;四极杆温度:150℃;倍增电压:1 247 V;发射电流:34.6μA;接口温度:250 ℃;质量范围:35~500 amu;电子能量70 Ev。3 结果与讨论
用GC-MS分析法从余甘子叶挥发油共分离出29个峰(见图1)。用气相色谱数据处理系统,以峰面积归一法测得其中各组分的相对百分含量,对总离子流图中的各峰经质谱扫描后得到质谱图,经过NIST98质谱计算机数据系统检索,结合人工谱图解析,按各色谱峰的质谱裂片图与文献核对,对基峰、质荷比和相对丰度等方面进行直观比较,鉴定了其中26个峰,占总挥发油成分的90%以上,结果见表1。 表1 余甘子叶挥发油的化学成分由表1 可知,已鉴定的化合物占色谱流出组分峰面积的90%以上,主要为醇类、苯酚类及烷烃化合物。在已鉴定的组分中,相对含量较高的主要几种组分有叶绿醇(19.00% ) 、2,4-二叔丁基苯酚 (18.79% )和异植物醇 (10.54% )。这些化合物形成了余甘子叶的特有气味。另外还有3种组分的含量相对较少,未能鉴定,有待进一步研究。
有关余甘子叶挥发油的化学成分研究,目前国内外尚未见报道,本文采用GC-MS方法,对余甘子叶挥发油的化学成分进行了研究,鉴定了其中的26种成分。该法简便、快速、灵敏度高。本研究为余甘子叶挥发油的应用拓开了广阔的前景。
【参考文献】
[1] 张兰珍,赵文华,郭亚健,等.藏药余甘子化学成分研究[J].中国中药杂志,2003,28(10):940.
[2] 钟振国,曾春兰.余甘子叶提取物体外抗菌实验研究[J].中药材,2008,31(3):428.
[3] 曾春兰,钟振国.余甘子叶提取物体外抗肿瘤作用研究[J].时珍国医国药,2008,19(3):580.
[4] 潘国庆,赵旭升,蒋炘治.余甘子抗氧化作用的研究[J].青海科技,2007,12(6):33.
[5] 刘丽梅,高 政,李宝文. 余甘子对实验性颈动脉粥样硬化家兔的影响[J]. 中国临床康复, 2003,7 (5) : 766.
[6] 王绿娅,王大全,秦彦文,等. 余甘子抗脂质过氧化和保护血管内皮的实验研究[J]. 中国药学杂志, 2003, 38 (10) : 505.
[关键词] 拉曼光谱;定量分析;实验教学
[中图分类号] G642
[文献标识码] A
[文章编号] 2095-3712(2014)22-0058-03[ZW(N]
[作者简介]张焕君(1982―),女,河南许昌人,硕士,郑州轻工业学院教师;程学瑞(1982―),男,河南安阳人,博士,郑州轻工业学院副教授,研究方向:材料物理。
拉曼光谱的强度、频移、线宽、特征峰数目以及退偏度与分子的振动能态、转动能态、对称性等特性有紧密的联系,即与分子的结构紧密相关。而且拉曼光谱具有制样简单,分析快速、无损,所检测的样品仅需微量即可满足测量要求等诸多优点,因而成为研究分子结构的强有力工具,广泛地应用于分子的鉴别、分子结构的研究、分析化学、石油化工催化和环境科学等各个领域[1-2]。然而,相对于气相、液相色谱法的较高精度而言,较大的分析误差率限制了拉曼光谱定量分析的应用。在实际应用中,拉曼光谱分析技术多用于样品的定性分析,尤其是在实验教学当中,更多的是强调其定性分析的作用,而忽略其定量分析的功能[3-4]。尤其是对具有强荧光背景物质,如乙醇及其混合溶液的定量分析,更是拉曼光谱定量分析中的难点问题。
为帮助学生克服这样单一的认识,我们在教学实验环节增加了相关实验内容,采用拉曼光谱对乙醇溶液的浓度进行定量分析。在教学过程中,我们向学生介绍了拉曼光谱定量分析的理论依据、分析过程,并着重分析了误差来源,以加深学生对拉曼光谱的认识,尤其是让学生对其定量分析功能有了进一步的了解。
一、理论依据
拉曼光谱定量分析的理论依据为:
I=KΦC∫b[]0e([WTBZ]ln[WTBX]10)(k+k)zh(z)dz
在上式中,I为光学系统所收集到的样品表面拉曼信号强度;K为分子的拉曼散射截面积;Φ为样品表面的激光入射功率;k、k′分别是入射光和散射光的吸收系数;Z为入射光和散射光通过的距离;h(z)为光学系统的传输函数;b为样品池的厚度。由上式可以看出,在一定条件下,拉曼信号强度与产生拉曼散射的待测物浓度成正比,即I∝C。
二、实验过程
实验样品材料为国药集团化学试剂有限公司生产的浓度不低于99.7%的分析纯乙醇、四氯化碳和去离子水。把不同体积的去离子水加入乙醇样品中,配制成不同浓度的乙醇-水二元体系溶液;用激光功率为50mW(100%)的拉曼光谱仪采集纯乙醇溶液、水、四氯化碳溶液的拉曼光谱图;用拉曼光谱仪采集不同浓度的乙醇溶液的拉曼光谱图,对每种浓度的样品重复扫描3次,试验结果取三次扫描的平均值。
三、结果讨论
把配制好的不同浓度的乙醇溶液加入未受污染的样品池,把不同浓度的样品分别放在拉曼光谱仪上测出其拉曼光谱。荧光背底扣除后不同浓度的乙醇-水溶液的拉曼光谱图如图1所示。
图1荧光背底扣除后不同浓度的乙醇-水溶液的拉曼光谱图
表1中的数据进一步显示出,随着乙醇浓度的增加,特征峰强度的比值在不断增加。纯水的3200cm-1峰的强度I2与不同浓度乙醇的884cm-1峰的强度I1之比R1和面积比R2与乙醇浓度的关系见表1。拟合图如图2所示,R1和R2与乙醇浓度有较好的线性关系,其线性相关系数分别为0.98554和0.97558。
四、误差分析
激光功率、样品池、聚焦位置等因素会对定量分析结构有重要影响。
(一)激光功率的影响
不改变聚焦样品的位置,激光功率分别选取100%、50%、10%、5%、1%和0.5%(100%为50mW),对50%的乙醇-四氯化碳溶液进行测试,结果如表2所示。
由表2可以看出,随着激光功率的改变,两个特征峰(峰459cm-1和884cm-1)的强度比值基本上在2.3左右,面积比值基本上在3.0左右。然而可以看出,当激光功率很小时(1%或0.5%),由于激发光源本身很弱,导致散射的拉曼信号强度本身也非常弱,而且信噪比很大,所以相对误差比较大。而且当激光功率很强(100%功率)时,两个特征峰的强度比值和面积比值都稍微偏离2.3和3.0,其原因可能是,激光功率很强时,其信号强度和荧光信号也比较强,而荧光对拉曼散射的干扰非常大,导致在扣除荧光背底过程中出现较大的偏差。
(二)样品池的影响
如图4是毛细管样品池的拉曼光谱图,实验过程中用毛细管吸取待测溶液。毛细管作为样品容器,在激光激发下也存在拉曼光谱和荧光背底,在基线处理和背底扣除过程中难以完全消除其影响,进而产生误差。
图4毛细管样品池的拉曼光谱图
(三)聚焦位置的影响
在同一样品不同点进行多次测量,分析结果发现,混合溶液的特征峰强度的比值存在较大的偏差,主要原因可能是本次试验使用的是显微共聚焦激光拉曼光谱仪,3次测量的聚焦位置不同,以及数据处理过程当中荧光背底的扣除都会引起较大的误差。对同一浓度的溶液测量3次,所得强度之比的不确定度为0.117,相对强度之比与乙醇浓度拟合直线的不确定度为0.024,相对面积比与乙醇浓度拟合直线的不确定度为0.858。
综上所述,激光功率、样品池、聚焦位置等因素会对拉曼光谱定量分析结构产生一定的影响。另外,乙醇的挥发、激光功率的稳定性、实验仪器的固有误差等因素也会对测试结果带来影响。然而,拉曼光谱定量分析的结果仍然有较大的可信度,可以作为一种有效的定量分析方法。
参考文献:
[1]谭红琳,李智东,张鹏翔,等.乙醇、甲醇、食用酒及工业酒精的拉曼光谱测定[J].云南工业大学学报,1999(2).
[2]杨丹,徐文艺.CuCl2-H2O体系和FeCl3-H2O体系络合物拉曼光谱研究与溶液拉曼定量分析探索[J].光谱学与光谱分析,2011(10).
关键词:吉首市 阳光体育 现状 建议
1.1 研究对象
以吉首市普通中学阳光体育运动开展现状为研究对象,结合随机与整群抽样的方法抽取吉首市一中,四中,雅思中学三所学校中的学生共600人为调查对象,其中男生315人,女生285人,体育教师共28人。
1.2 研究方法
文献资料法;访谈法;问卷调查法;数理统计法;逻辑分析法
2.研究结果与分析
2.1吉首市普通中学开展阳光体育运动现状调查
2.1.1吉首市普通中学师资力量现状调查
体育教师是学校体育活动的主导者,是“阳光体育”运动运行好坏的“指挥棒”,因此学校体育的师资情况直接关系到学生“阳光体育”的落实情况,教师学历的高低、体育教师的数量从一定程度上影响着教学质量的提高,从调查来看吉首市普通中学教师学历有待提高, 96%的体育教师均为大学本科,而硕士研究生仅占一小部分,其中大部分学校体育老师兼双职。此外由于体育教师的结构性缺编,体育教师和在校学生比例严重失调。这给阳光体育的开展造成一定影响。
2.1.2吉首市普通中学师生对阳光体育运动的了解程度调查
从调查得知,大部分体育教师对阳光体育这一概念还是比较了解,但学生对阳光体育的了解却不容乐观。在调查中有36% 的学生完全不了解这个概念;46% 的中学生只是基本了解;真正比较了解“阳光体育运动”的仅有18%。由此可知学生对阳光体育这一概念不清晰,学校和体育教师应加大宣传力度,使学生理解阳光体育的真正含义,自愿参与阳光体育运动,把身体锻炼得更好。
2.1.3吉首市普通中学学生参加体育锻炼时间的情况
从表1可以知,大部分学生不同程度地参加了体育活动,只是每周运动的次数偏低,每次活动的时间大部分都在三十分钟以下。其中每周活动五次以上的仅占一小部分。离我们“每天活动1 h”的要求还有一定的差距。
2.1.4 吉首市普通中学有无阳光体育运动专项拨款的调查
据调查得知,没有专项拨款的学校达到64%,而有专项拨款的为35%。在资金方面,大部分学校还不到位,这直接影响到学校阳光运动的开展。通过访谈得知,小部分学校有一定的体育活动经费,可资金很少。这是导致阳光体育未能很好实施的一个重要原因,原因主要是学校领导对阳光体育运动的不重视,把大量的人力,物力和财力用在其他科目上。
2.1.5吉首市普通中学场地器材现状情况调查
据调查可知,学生进行体育活动的主要场所与器材的配备明显不足,这与教育部规定的每生活动场地面积为3平方米相比,明显不成比例,通过我们对老师和学生的交谈得知学校的体育器材比较缺乏,并且有些体育器材已经比较陈旧,学校没有进行及时的更新体育设备。学校应在体育的硬件和软件上进行改善。使学校体育能更好的发展。让学生能有更加宽敞的活动环境和更加标准的体育场地。
2.2 影响吉首市普通中学阳光体育运动开展的原因分析
2.2.1 吉首市普通中学学校领导对开展“阳光体育”运动的态度
学校领导对“阳光体育”运动的重视程度,直接影响到学校体育活动的组织和开展,因此学校领导对开展“阳光体育”运动的态度是影响吉首市普通中学阳光体育运动开展的一个直接原因。
2.2.2 吉首市普通中学体育教师师资力量状况
目前吉首市普通中学体育教师存在结构性失调,体育教师的数量无法满足学生的需要;因此,吉首市政府要加大教师人事改革,增大体育教师数量,注入年轻新力量,改革管理机制,以便更好的开展阳光体育运动。
2.2.3 吉首市普通中学学校场地器材配备及资金情况
阳光体育运动的开展必须依赖于体育场地和器材,而体育器材的使用频率高,需要投入大量的资金作为购买器材和维修,通过访谈与调查发现吉首市普通中学缺乏资金保障,体育器材得不到更新.因而使阳光体育运动没有收到预期的效果.
3.结果与建议
3.1 结果
3.1.1吉首市普通中学的体育师资力量不足,体育教师和学生对阳光体育运动了解不透彻。每天的体育活动时间达不到一小时。
3.1.2学校领导对阳光体育运动在校园的开展,还没有形成足够的重视,学校的场地器材条件有限。
3.1.3学校对开展阳光体育运动的经费缺乏;没有充足的资金保障,另外,体育教师工作量大,新生力量补充不足。
3.2 建议
3.2.1学校领导重视关心阳光体育运动,各级部门加强宣传,制定详细和长远的实施方案,设立专项资金,为阳光体育运动进一步开展提供条件保障。
3.2.2教育部门重视,建立和完善学校体育的管理制度,将学生每天一小时体育活动纳入学校督导内容及评估体系,把学生体质健康状况作为评价教育工作的重要指标。
3.2.3继续升化学校体育改革,加大课程资源开发与利用,把课外体育活动开展得丰富多彩,使之成为全体学生参与实践阳光体育运动的主要形式。(作者单位:1.上海体育学院,体育教育训练学院;2.上海体育学院,中国乒乓球学院)
参考文献
[1] 教育部、国家体育总局、.关于全面启动全国亿万学生阳光体育运动的通知[Z].教体艺[2006]6 号,2006-12-20.
[2] 苗秀丽.开展亿万学生阳光体育运动的认识与思考[J].哈尔滨体育学院学报,2002(2):43-44.
[3] 朱志军.阳光体育”伴新世纪青少年健康成长[J].管理论坛,2007(8):47-48.
关键词关键词:极限学习机;模式识别;高光谱遥感图像;判别信息
DOIDOI:10.11907/rjdk.162600
中图分类号:TP317.4文献标识码:A文章编号文章编号:16727800(2017)001016105
对于连续狭窄的光谱带,高光谱成像传感器能够捕获详细和丰富的光谱信息。近年来,随着图像处理技术的发展,高光谱图像得到广泛应用,在高光谱图像应用中最重要的任务是对图像进行分类。然而,在高光谱遥感图像分类问题中存在一些挑战。例如有限训练样本之间的不平衡和高维度,高光谱遥感图像几何形状复杂,高光谱遥感图像分类计算复杂度高。为使高光谱遥感图像分类取得良好效果,近年来,机器学习方法在高光谱图像分类中得到广泛应用,例如人工神经网络(Artificial neural networks,ANNs)[1]、支持向量机(Support vector machine,SVM)[2]、多项逻辑回归(Multinomial logistic regression,MLR)[3]、主动学习(Active learning,AL)[4]等,其它方法如利用稀疏表示[5]以及谱聚类[6]对高光谱进行分离也得到广泛应用。然而,由于高光谱遥感图像具有{维度以及复杂性,通过机器学习算法寻找最优的参数来进行分类通常非常困难,并且耗时,实现高光谱遥感图像高效快速分类已成为遥感图像领域的重要问题。
近年来,Huang等[7]基于单隐层前馈神经网络(Single-hidden layer feedforward networks,SLFNs)结构提出了极限学习机(Extreme learning machine,ELM)。ELM随机产生隐层节点的输入权值和偏置值,所有参数中仅有输出权值经过分析确定。ELM将传统神经网络的求解过程转化为一个线性模型,ELM随机选择输入权值和分析确定SLFNs的输出权值,避免了传统神经网络学习方法收敛速度慢及陷入局部极小解的可能,具有更好的泛化能力和更快的学习速度。文献[7]指出ELM通过随机产生隐层节点的输入权值和偏置值分析确定输出权值,保持了SLFNs的通用逼近能力,同时能够得到一个全局最优解。由于ELM良好的泛化能力,使得ELM应用在不同的领域中。在高光谱遥感图像领域,Pal等[8]将ELM应用到土地覆盖分类中,与BP[9]神经网络和支持向量机相比,ELM取得了更好的分类效果,并且ELM算法的计算复杂度远远小于BP和支持向量机。Bazi等[10]利用差分进化方法优化核ELM算法的参数,提高了高光谱遥感图像的分类效果。为了提高ELM算法在高光谱遥感图像分类中的稳定性,Samat等[11]基于Bagging 和 AdaBoost算法提出了集成的极限学习机算法(Ensemble extreme learning machine,E2LM)。
虽然针对高光谱遥感图像分类问题,研究人员在ELM算法的基础上提出了改进,然而 ELM及其改进算法并未充分考虑数据样本间的几何特征和数据蕴含的判别信息。知道样本之间具有某些相似的属性和分布特征,样本之间的相似属性和分布特征能够弥补ELM学习不够充分的问题,进而可以提高ELM的泛化能力,因而数据样本的几何特征和数据蕴含的判别信息对ELM的分类性能具有重要作用。
基于以上分析,本文提出一种基于判别信息极端学习机(Discriminative information regularized extreme learning machine,IELM),对于分类问题,IELM同时考虑到数据样本的几何特征和数据蕴含的判别信息,通过最大化异类离散度和最小化同类离散度,优化极端学习机的输出权值,从而在一定程度上提高ELM的分类性能和泛化能力。IELM方法的优势在于:①继承了ELM的优点,在一定程度上避免了ELM学习不充分的问题;②将异类离散度和同类离散度引入到ELM中,充分利用数据样本的判别信息;③利用MMC[12]方法有效解决最大化异类离散度和最小化同类离散度矩阵奇异问题。
为评价和验证本文提出的基于判别信息极端学习机的高光谱遥感图像分类方法,实验使用Indian Pines,Salinas scene两个高光谱遥感图像数据,将本文所提出的方法与ELM、支持向量机(Support vector machine,SVM)、最近邻分类器协作表示(Collaborative representation nearest neighbor classifier,CRNN)[13]进行对比,实验结果表明本文提出的算法能够取得较好的分类效果。
实验环境为惠普工作站处理器:Intel(R)Xeon(R) CPU E5-1603 0 @2.80 GHz,安装内存:8.00GB ,系统类型:64位操作系统,版本:win7,语言开发环境采用 Matlab 2010b。
第一组实验数据为Indian Pines遥感图像数据,Indian Pines数据是AVIRIS传感器在萨利纳斯山谷收集的数据,该图像包含200个波段,图像大小为145×145,地表真实分类如图1所示,Indian Pines数据集属性设置如表1所示。
第二组实验数据为Salinas scene遥感图像数据,Salinas scene数据是AVIRIS传感器在萨利纳斯山谷收集的数据,该图像包含204个波段,图像大小为512×217,地表真实分类如图2所示, Salinas scene数据集属性设置如表2所示。
实验中,对于Indian Pines和Salinas scene图像数据,随机选取1%的数据样本作为训练集,剩下部分为测试集,使用总体精度(OA),Kappa系数,平均准确率(AA)衡量不同算法的性能。
(1)体精度。总体精度(overall accuracy,OA)是对分类结果质量的总体评价,等于被正确分类的像素总和除 以总的像素个数。被正确分类的像素沿着混淆矩阵的对角线分布,它显示了被正确分类到真实分类中的像元数。根据混淆矩阵可得OA的计算式为:p=∑ci=1miiN(21)其中,c表示类别数目,mii表示混淆矩阵对角线上的元素,N=∑ci=1∑cj=1mij表示测试样本的总数。
(2)Kappa系数。Kappa系数采用一种多元离散分析技术,反映分类结果与参考数据之间的吻合程度,它考虑了混淆矩阵的所有因子,是一种更为客观的评价指标,其定义为:k=N∑ci=1mii-∑ci=1(mi+m+i)N2-∑ci=1(mi+m+i)(22)其中,mi+,m+i分别表示混淆矩阵第i行的总和、第i列的总和,c表示类别数目,N为测试样本总数,mii表示混淆矩阵对角线上的元素,Kappa系数越大分类精度越高。
(3)平均精度。平均精度(average accuracy,AA)定义为每类分类准确率相加除以类别总数。AA=∑ci=1accic(23)其中,c表示类别数目,acci表示每类的分类准确率。
4.2实验结果及分析
将IELM与ELM,SVM,CRNN进行对比,SVM采用libsvm工具箱,核函数采用径向基核函数(Radial basis function,RBF),惩罚参数c=0.02,核函数参数g=0.02,IELM与ELM均采用Sigmoid函数作为激活函数,隐层节点个数设置为500,惩罚参数c=20。
5结语
本文提出了一种基于判别信息极端学习机的高光谱遥感图像分类方法,创新之外在于考虑到光谱遥感图像数据的联系和差异信息。IELM引入同类离散度和异类离散度的概念,体现了输入空间数据的判别信息,通过最大化异类离散度和最小化同类离散度,优化极端学习机的输出权值。与NN,SVM, ELM算法的对比实验表明,本文所提出方法的分类效果优于NN,SVM,ELM算法。
参考文献:
[1]Q SAMI UL HAQ,L TAO.Neural network based adaboosting approach for hyperspectral data classication[J].International Conference on Computer Science and Network Technology(ICCSNT),2011:241245.
[2]J A GUALTI,R F CROMP.Support vector machines for hyperspectral remote sensing classification[J].in Proc.SPIE 27th AIPR Workshop:put.Assisted Recognit.Int.Soc.Opt.Photonics,Washington,DC,USA,1999:221232.
[3]J Li,J BIOUCASDIAS,A.PLAZA.Semisupervised hyperspectral image classification using soft sparse multinomial logistic regression[J].IEEE Geosci.Remote Sens.Lett,2013,10(2):318322.
[4]W DI,MM CRAWFORD.Active learning via multiview and local proximity coregularization for hyperspectral image classification[J].IEEE Journal of Selected Topics in Signal Processing,2011,5(3):618628.
[5]J BIOUCASDIAS,M A T.FIGUEIREDO.Alternating direction algorithms for constrained sparse regression:application to hyperspectral unmixing[J].Hyperspectral Image and Signal Processing:Evolution in Remote Sensing (WHISPERS),2010:14.
[6]Y TARABALKA,J A BENEDIKTSSON,J CHANUSSOT.Spectralspatial classification of hyperspectral imagery based on partitional clustering techniques[J].IEEE Transactions on Geoscience and Remote Sensing,2009,47(8):29732987.
[7]GB HUANG,H ZHOU,X DING,et al.Extreme learning machine for regression and multiclass classification[J].IEEE Trans.Syst Man Cybern B,2012,42(2):51329.
[8]M PAL,A E MAXWELL,T A WARNER.Kernelbased extreme learning machine for remotesensing image classification[J].Remote Sens.Lett,2013,4(9):853862.
[9]D RUMELHART,G HINTON,R WILLIAMS.Learning by backpropagating errors[J].Nature,1986,323(6088):533536.
[10]Y BAZI.Differential evolution extreme learning machine for the classification of hyperspectral images[J].IEEE Geosci.Remote Sens.Lett,2014,11(6):10661070.
[11]A SAMAT,P DU,S LIU,et al.E2LMs:ensemble extreme learning machines for hyperspectral image classification[J].IEEE J.Sel.Topics Appl.Earth Observ.Remote Sens,2014,7(4):10601069.
[12]H LI,T JIANG,K ZHANG.Efficient robust feature extraction by maximum margin criterion[J].IEEE Transactions on Neural Networks ,2006,17(1):157165.