时间:2023-03-17 18:05:29
序论:在您撰写中文科技论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
关键词:自然语言处理;特征提取;语法;语义;语用
中图分类号:TP391.4 文献标识码:A文章编号:1009-3044(2007)16-31112-03
Feature Selection Research of the Chinese Technology Text based on Natural Language Processing
CHEN Pin
(Automation Department, Xiamen University,Xiamen 316005,China)
Abstract:With the development of China’s technology and economy, Chinese technology texts are full of the whole Net in the form of electronic text. So, Chinese technology text classification research has become a hot theme in the information domain. This paper set up a new feature selection model based on natural language processing. And based on this model, analyses in terms of syntax , semantics and pragmatics .
Key words:Natural Language Processing; Feature Selection; Syntax; Semantics; Pragmatics
1 引言
从50年代的机器翻译和人工智能研究开始,自然语言处理(Natural Language Processing,简称NLP)已有长达半个多世纪的历史。自然语言处理是研究如何让计算机理解和生成人们日常所使用的语言(如汉语,英语等)。目的在于建立起一种人与机器之间的密切而友好的关系,使之能进行高度的信息传递与认知活动。[1]
本文基于自然语言处理理论及方法[1][2],以及中文科技论文文本其自身较强的领域特征,建立了文本特征提取模型,并从语法、语义和语用三个层面来分析处理,同时也用于解决自然语言中的多义、同义和相关性问题。
2 基于自然语言处理的特征提取模型
本文研究的对象是中文科技论文文本,很自然会遇到自然语言的各种问题。因此构建一个优秀的自然语言处理模型[3],是我们有效处理自然语言的关键所在,具有深刻的意义。基于自然语言处理的特征提取模型由词汇层特征向量输入、语法分析、语义分析、语用分析和概念层特征向量输出等部分组成。模型结构如图1所示。
基于自然语言处理的特征提取模型过程如下:首先输入词汇层特征是已经经过预处理后的词汇,包括词性标注、句子编号等等。然后对相同句子编号的词汇采用分而治之的方法进行语法分析,即组块分析。再是利用已经经过处理的语料库中的词汇建立领域概念树,并基于领域概念树进行概念语义分析。最后是语用分析,利用词间相似度和关联度进行语境分析。整个模型中,随着语法层面到语义层面再到语用层面,语言的处理程度逐步趋于细化,其精度也随之提高。
图1 基于自然语言处理的特征提取模型
3 语法分析
语法分析虽然经过几十年的研究和发展,但仍然是一个瓶颈问题。因此目前通常采用“分而治之”的原则,来降低完全句法分析的难度,进行部分的句法分析,我们也称之为组块分析。因此,本文结合Abney组块描述体系[4],定义汉语语法基本成分为各组块形式。并在此基础上提出了一种基于词性判断规则的组块分析策略,用于解决中文科技论文文本分类过程中的自然语言问题。
其中,组块标记集如表1所示。
表1 组块标记集
词性标记集如表2所示。
表2 词性标记集
在本论文中,我们分析组块的方法主要是采用基于词性判断规则的组块分析策略(Chunk Analysis base on Part of speech Rule,简称CABPos):
设组块标记(Chunk Sign)记为CS;词性标记(Pos Sign)记为PS;->表示前后标记符,如s->p表示主语组块在谓语组块前;每一个进行语法分析的句子(即词串),记为Seni=ti1ti2…tim,其中seni为第i个句子,tij为第i个句子中的第j个词汇;把每个句子等分为前、中、后三部分,分别记为Ti1,Ti2,Ti3;关联词表为RT。
判断规则如下:
4 语义分析
目前,比较成熟的语义分析手段主要有格语法,语义网络,义素分析法,优选语义学和蒙塔格语法等等[6]。本文将结合中文科技论文文本的强领域特征在原有概念树模型的基础上创建一个领域概念树模型,并在此基础上进行概念语义分析。从而很大程度上解决了自然语言的同义现象和相关性问题,提高了文本分类的准确率。
4.1 领域概念树
从语义角度上分析,中文科技论文文本往往具有强的领域特征。比如说,“禅宗”、“僧人”等词汇就明显地带有强烈的“人文科学-宗教-佛教”领域的词汇色彩;而“中超”、“切尔西”、“角球”等词汇就明显地带有浓郁的“人文科学-体育-足球”领域的词汇色彩。因此,本文在传统概念树基础上结合中文科技论文文本强领域特征构建一个新的语义模型――领域概念树。如图2所示。
图2 领域概念树
4.2 基于领域概念树模型的概念语义分析算法
向量空间模型是文本分类特征提取中用得最多的特征模型,因为它够简单,而且特征提取的效果也不错。那么在VSM中,如何才能把领域概念树中的概念反映到特征项中,我们是这样处理的。
在数学上,词汇层映射到概念层,可用下式表示:
(8)
式中,T0为词汇层特征向量,Ts为概念特征向量,T可以用标题名B、作者情况Z、中文摘要W、关键词G、正文ZW和参考文献CK等替代。
基于领域概念树的概念语义分析算法主要包括下列操作:
设概念领域树中各概念词汇集,标记为CDS。
Step1 输入词汇层特征向量:
(9)
式中Fi表示特征向量中的第i个特征项。该特征项函数主要变量是ti、wi和CS(ti),也可以包含其他特征项信息;其中ti是特征词汇;wi是特征词汇的权重,CS(ti)是词汇ti的组块标注。
Step2 对词汇层特征向量中各特征词汇,通过领域概念路径以及组块标注归并属于同一概念层次的特征词汇。
式中T′i表示属于同一概念层次的词汇;ci表示归并后Ti概念层次代码标记。
Step3 计算属于同一概念层次的特征词汇T′i所对应的概念权重。
式中ρi表示同一概念层特征词汇T′i的概念权重。
Step4 输出基于领域概念树的概念层特征向量:
由此可见,基于领域概念树模型的概念语义分析,如果特征项中参数词汇属于领域概念树中的某领域层的概念词汇,那么该词汇就能增强它在该领域层的权重系数,极大地解决了同义词等语义问题,提高了分类的精确度。
5 语用分析
语用分析可以理解为词汇的上下文语境的分析。本文中,自然语言处理在语义、语用层面上所描述的词汇是基于领域概念树中的概念词汇。因此,本文基于词汇间相似度和关联度,提出了一种语境分析方法。
从数学角度上来分析,基于词汇间相似度和关联度的语境语用分析过程,可以用下式来表示:
式中Ts是概念语义分析后的特征向量,Tr是语境语用分析后的特征向量,T可以用标题名B、作者情况Z、中文摘要W、关键词G、正文ZW和参考文献CK等替代;ξ是词汇间相似度的阈值;η是词汇间关联度的阈值。
基于词汇间相似度和关联度的语境分析算法主要包括下列操作:
Step1输入概念语义分析后的特征向量:
Step2对概念层中的词汇进行词间相似度计算,如公式(16)和(17):
Step3对概念层中的词汇进行词间关联度计算,如公式(18)-(20):
Step4通过实验获得词汇间相似度的阈值ξ和词汇间关联度的阈值η,取词汇间相似度Simlexical(ti,tj)>ξ和关联度Relaxical(ti,tj)>η的词作为新的特征项。
Step5 输出经过语境语用分析后的特征向量:
此算法主要是通过词间相似度和关联度来判断同一概念层次上词汇间的相关性,从而进一步改善了自然语言处理过程的性能,来提高文本分类的准确率。
6 举例
为了具体说明该方法,以某标题名来举例说明,如下所示:
标题名:计算机病毒防治的协同理论与法律对策
设t1="计算机",t2="病毒",t3="防治",t4="协同",t5="理论",t6="法律",t7="对策"。B0表示标题名原始特征向量;Bs表示标题名经过语义分析后的特征向量;Br表示标题名经过语境分析后的特征向量。
首先语法分析(组块分析):
表3 组块分析结果
然后语义分析:
标题中词汇在领域概念树模型中所对应的概念,如表4所示。
表4
所以该标题名的原始特征向量B0为:
最后语用分析:
词间相似度关系(a=2),如表5所示。
表5 词间相似度
词间关联度关系(K=4),如表6所示。
7 结论
本文利用自然语言处理的理论与技术,构建了基于自然语言处理的文本特征提取模型,并从语法、语义和语用三个层面分析,使自然语言的处理程度逐步深化。语法层面上,我们利用了基于词性判断规则进行组块分析;语义层面上,则结合中文科技论文文本的强领域特征创建了领域概念树模型,并在此基础上进行了概念语义分析;语用层面上,基于概念层上词汇间的相似度和关联度,进行了语境语用分析。
参考文献:
[1]刘颖.计算语言学[M].北京:清华大学出版社,2002.
[2]张春霞,郝天永.汉语自动分词的研究现状与困难[J].系统仿真学报,2005(17),1:138-145.
[3]Mladenic D, Grobelnik M.Feature selection for unbalanced class distribution and Na?ve Bayes [A].Proc of 16th Inter Conf on Machine Learning ICML-99[C].San Francisco, CA: Morgan Kaufmann Publishers, 1999:258-267.
[4]王怡,盖杰,武港山等.基于潜在语义分析的中文文本层次分类技术[J].计算机应用研究,2004,8:151-154.
[5]姚天顺.自然语言理解[M].北京:清华大学出版社,1995.
[6]王晓龙.自然语言处理的若干问题研究.哈尔滨工业大学,2004
[7]刘挺.语言模型.哈工大信息检索研究室,2004
科学技术是第一生产力,科学技术的创新离不开科技论文。通常人们将科技会议论文和科技期刊论文统称为科技论文。科技论文按写作语言的不同可分为中文科技论文和外文科技论文。外文科技论文以英文科技论文为主。英文科技论文比中文科技论文的数量多。众多的科研成果以英文科技论文形式发表,因此很有必要提高英文科技论文的阅读水平。
科技论文与科普文章不同。科普文章是写给公众看的,它具有一定的文学性和艺术性。科技论文是写给同行专家看的,它具有很强的逻辑性。科技论文的逻辑性在文字上表现为句子之间的衔接十分紧密,因此掌握句子之间的各种衔接方法有助于提高英文科技论文的阅读水平。
1 语法衔接
语法衔接包括省略、替代、照应和连接等多种方法,这些方法有助于增强英文科技论文的逻辑性和连贯性。
(1) Computers exist in a wide range of sizes and power. (2) The smallest are embedded within the circuitry of appliances, such as televisions and wrist watches.
句(2)中The smallest后面省略了在上文句(1)中已经出现的computers。采用省略的衔接方法避免了在句(2)中重复出现computers,突出了句(2)中的新信息“The smallest”,使得句子之间更加紧凑。
(3) Laptop computers and PCs are typically used in businesses and at home to communicate on computer networks, for word processing, to track finances, and to play games.
(4) They have large amounts of internal memory to store hundreds of programs and documents.
(5) In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language.
(6) This led to the formation of Microsoft in Albuquerque, New Mexico, in the same year.
句(4)用人称代词They指上文句(3)中的Laptop computers and PCs,用人称代词起到照应的作用。句(6)用指示代词This指前面In 1975, Gates and Paul Allen collaborated on the first version of the BASIC programming language整个句子所表达的意思,用指示代词起到照应的作用。这种照应的衔接方法使得科技论文更加简洁,表达的意思更加清晰。
(7) A laser used with the erbium-doped fiber can then be triggered without first having to convert weakened light pulses into electrical signals.
(8) As a result, with no intervening optical / electronic conversions to slow down transmissions, fibers can carry more information in the form of higher speed signals.
句(8)中的As a result表示句(7) 与句(8)之间是一种因果关系。还有一些过渡性的词语可以表示转折、时间、条件和因果等逻辑关系。掌握起衔接作用的过渡性词语,有助于把握科技论文的内在逻辑。
2词汇衔接
为了进一步增强英文科技论文的逻辑性和连贯性。英文科技论文除了应用语法衔接的方法,还大量使用词汇衔接的方法。词汇衔接包括重复、同义、反义、上下义等多种方法。
(9) The secret to perfect timing is to make an extra satellite measurement.
(10) If three perfect measurements can locate a point in 3-dimensional space, then four imperfect measurements can do the same thing.
句(9)中出现了measurement(单数形式),句(10)中又重复出现了measurements(复数形式),这种词汇重复方法不但使得两个句子更加紧密,而且突出了论文要表达的重要信息(measurement)。
(11) If everything were perfect (i.e. if our receiver’s clocks were perfect) then all of our satellite ranges would intersect at a single point (which is our position).
(12) But with imperfect clocks, a fourth measurement, done as a cross-check, will NOT intersect with the first three.
(13) Funding such an immense project would cost more than $230 billion over several decades.
(14) To make this investment economically feasible, phone companies want new laws that would let them supply programming as well as carry it for other companies.
(15) Some cable-TV companies, broadcasters, (下转第79页)(上接第74页)and publishers strongly oppose the entry of such powerful competitors.
(11)中的perfect与句(12)中的imperfect是一对反义词,利用反义词衔接两个句子,起到了强烈的对比作用。句(13)中的Funding与句(14)中的investment是一对同义词,利用同义词衔接两个句子,不但可以避免用词过于单调,还可以起到了强化同义词所表达意思的作用。句(14)与句(15)利用上下义词衔接两个句子,句(14)中的companies是个上义词,它抽象地指公司,句(15)中的cable-TV companies, broadcasters和 publishers是下义词,它们具体指有线电视公司、广播公司和出版商。
熟练掌握各种衔接方法,有助于把握科技论文的内在逻辑性,并快速准确地获取英文科技论文所包含的信息,达到提高英文科技论文阅读水平的目的。
一、中外科技学术期刊出版及其数据库的模式对比
到目前为止,西方先进国家的科技学术期刊的出版一般有下述三种主要的模式。
第一种模式是编辑部与出版社合作的模式,首先由主办单位的期刊编辑部负责收稿、稿件审理和修改、决定稿件录用与否等工作。一旦稿件定稿,则以后的排版、版权认定、校对、出版、(网络)单行本寄送、纸本期刊发行、数据库收录发行等工作全部由出版社负责,包括与作者的联系和互动。一般来说,一个出版社与很多期刊社或编辑部签订合作协议,其中网络投稿软件的开发通常由出版社统一负责开发,交给期刊社或编辑部使用,因此通常可以看到,由同一家出版社出版的不同期刊有着类似的投稿系统和主页,它们都在出版社的主页下有链接。
第二种模式是学术团体式的出版形式,有些大的学术团体或研究所,同时主办好几份期刊,学术团体同时兼备出版社的资格和功能,专门出版相应的科技期刊,这些期刊通常由学术团体负责审稿和出版的全过程,例如,美国电气电子工程师协会(IEEE)、美国化学会(ACS)、美国数学会(AMS)、英国皇家学会(RS)和英国皇家化学会(RSC)等都有自己的科技期刊及数据库。
第三种是期刊社把所有的流程都包揽了,这种模式通常是一些电子版期刊,他们实行网络化出版和OpenAccess(OA)的模式,让读者免费下载浏览。
与上述三种模式相对应的数据库通常是:第一种模式的全文数据库就在出版社,这个数据库是出版社的商业盈利资源,如SpringerLink数据库、ElsevierScienceDirect数据库;第二种模式的全文数据库在学术团体如学会,虽然学会是非营利机构,但是数据库也是盈利资源;第三种模式的全文数据库就在期刊社,通常主要以交流被引用为目的,不以营利为目的。目前,也有一些出版社旗下的部分期刊实行OA模式,例如,HandawiPublishingCorporation旗下就有不少实行OA的期刊。
至于二次文摘数据库,通常与学会、信息研究所(公司)、科技情报研究所等研究单位相联系在一起,如美国数学学会(AMS)的MR、美国化学文摘服务社(CAS)的CA、美国工程信息公司(EngineeringInformationInc.)的EI、美国科学研究所(ISI)的SCI和ISTP、德国数学文摘社的ZBLMATH、英国机电工程师学会(IEE)的INSPEC、俄罗斯全俄科学技术信息研究所(VINITI)的《文摘杂志》AJ。这类数据库主要提供一次文献的摘要、评论、索引信息、检索,旨在为科学研究者和工程技术人员提供专业、实用的数据、知识等信息服务,支持最新的研究。
科技期刊数据库的发展是伴随科学技术的发展而发展的,数据库产品的传播由纸本、磁带、软盘、光盘等发展到今天的网络数字化传播,西方发达国家的学术期刊出版和数据库已经形成了成熟的模式,严格遵循版权保护的基本原则,除了OA期刊,全文数据库和二次文献数据库基本是商业操作的模式。
长期以来,中国的科技学术期刊的出版基本上停留在编辑部负责审稿出版的全过程(各自为政)的阶段,当然有些编辑部把排版印刷工作交给一些专业的排版公司和印刷厂,发行方面一般是邮局发行、代办发行、自办发行3种形式。目前,已经有一些英文版的中国科技学术期刊与国外的出版社合作,走上述的第一种模式的路子,但是这只占很小的比例,因为中文期刊毕竟占绝对多数。
我国的科技期刊数据库始于1989年由重庆维普资讯有限公司(其前身为中国科技情报所重庆分所数据库研究中心)创建的以软盘形式发行的中文科技期刊篇名数据库,后发展成为网路版的中文期刊数据库(简称维普)。维普与中国知网(CNKI)、万方数据化期刊合称为3大中文电子期刊数据库。其中中国知网是中国知识基础工程(NationalKnowledgeInfrastructure,CNKI)中的一个重要组成部分,由1995年立项的清华大学《中国学术期刊(光盘版)》发展而来,是目前国内最大的网上期刊信息资源之一。万方数据化期刊是科技部“九五”重点科技攻关项目“科技期刊网络服务系统”的一个组成部分,由中国科技信息研究所主办,1990年建成并出版了涵盖1.6万家企业的中国第一家商业化商情类数据库。3家中文科技期刊数据库的主体都是针对科技期刊的全文收录,其操作模式基本上是由期刊编辑部提供期刊的纸本或电子资源,再制作成数据库的资源。与国外文献数据库载体的发展模式相同,我国的文献数据库同样经历了从磁带—光盘—网络的发展过程,且目前网络型数据库已成为中文科技期刊数据库的主要形式。
与国外科技期刊数据库的发展不同,中国的国情决定了我国的全文数据库与西方发达国家的学术期刊全文数据库有明显的不同。
首先,中文科技期刊数据库与其所收录的科技期刊之间不存在从属关系,这是与外文科技期刊数据库的巨大差别。上面提到的国外科技期刊第一种和第二种出版模式,它们与科技期刊数据库有明显的从属关系和统一的操作模式。但我国的科技期刊数据库的服务商是由各情报所、研究院所和高等院校衍生出的公司,数据库的内容是由各科技期刊社(编辑部)所出版的科技期刊,两者间不存在从属关系。公司要以经济效益为首要目的。而数据库的建设要借助于各家独立于这些公司的科技期刊社(编辑部),其协调过程的困难性可想而知。
其次,我国科技期刊数据库所收录的期刊具有很大的重复率。无序竞争、政企不分、以权代法是造成这一现象的重要原因。另一方面,全社会知识产权意识不强,没有形成尊重知识的社会氛围,是这种现象产生的社会根源。中文科技数据库建设初期,由于各数据库的建设单位多为情报所、研究院所和高等学校等国家事业单位,缺乏市场经济的体制规范和竞争意识,各个数据库并没有在信息资源建设上争取各家科技期刊社(编辑部)的独家授权。而各科技期刊社(编辑部)对被哪家数据库的收录所产生的知识产权等方面的问题并不太在意,任由各大数据库对期刊文章进行收录、整理和分类,甚至以进入数据库的多寡作为期刊的评价指标,似乎进入越多数据库就越“高档”和光荣。在这样的背景下,形成了中文科技期刊数据库所自身特有的一个不同于外文科技期刊数据库的怪现象,这就是数据库所收录期刊的高重复率,尤其以三大中文科技期刊数据库最为明显。
三大中文科技期刊数据库虽然所收录期刊不完全相同但存在相当高的重复率。这一方面造成了资源的大量浪费;一方面也为使用者带来巨大的不便。由于各数据库均为收费数据库,各图书馆在购买时往往需要购买2到3种,而其中一大部分都是相互重复的。针对这种情况,一些文章试图从各个数据库的异同进行比较来对图书馆的购买进行指导。
二、中文科技学术期刊数据库发展现状和挑战
由于中文科技期刊数据库必然走向商业化之性质,数据库商之间的竞争其实从各自成立的那天起就已经存在。只是数据库建设之初,由上所述各种原因,表现得不甚明显。进入21世纪以来,随着数据库产品移市场中所展现的巨大盈利能力和产品开发的逐渐完善,各数据库商之间的竞争日益激烈。尤其在数据库内容的争夺上表现得尤其明显。2000年某数据库公司被多家期刊杂志社因著作权问题,这当然是由各期刊社日益增加的版权意识所导致的必然结果,但更深层次的是数据库商之间的竞争结果。
这一时期,各家中文科技期刊数据库服务商为了扩大规模从而取得更大的经济效益,开始了针对科技期刊的“争夺战”。这个阶段的特点主要有几方面:
首先,以内容争夺为主,通过内容争夺实现经济效益最大化。由于数据库技术的普遍性和成熟性,数据库服务商所提供的服务业趋同化,即通过对所收录的各种科技期刊整理成数据库(网络版和光盘版)来提供文献检索和阅读的服务。因此,数据库的内容建设变得重要起来,从而形成了数据库服务商对信息资源——科技期刊的全文信息这一资源的争夺,而且各数据库商更加倾向于对科技期刊的独家收录。2008年下半年,多家科技期刊社(编辑部)收到了某数据库商关于独家收录的协议(征求意见版),竞争的激烈性由此可见一斑。目前,部分期刊社已实行独家授权的方式,这无疑会调整现有产业链中的关系,且迫使数据库商和刊社加强合作,从期刊内容的单纯数字化和网络向深层次的网络出版和信息服务拓展。科技期刊全文信息资源独家授权的争夺将是这段时期最显著的特征。
其次,过程中更重视著作权问题的处理。各个数据库在建设之初,我国关于数据库的版权问题尚无相应的法律法规,使得数据库商在信息资源建设过程中缺乏法律观念,忽视甚至侵害著作权人的著作权。为日后科技期刊数据库的发展带来了诸多隐患。随着我国法治化进程的加快,各家科技期刊著作权意识不断增强,且对科技期刊数据库重复收录的利弊有了更加深刻的认识。各数据库服务商也更加重视其所收录期刊文章的著作权问题。因此,在竞争过程不论是数据库商还是各种科技期刊都更加重视法律法规,通过运用法律法规来维护自身权益。
再次,数据库商以合作协商的姿态与各科技期刊社(编辑部)进行沟通。在尊重科技期刊社(编辑部)的意愿上,本着互利互惠、合作共赢的精神争取各科技期刊的全文收录。例如,中国知网将全年的财务收支情况公开发给各科技期刊社(编辑部),并通过提供各种有益信息,提供各种服务(如召开编辑培训会议)等方式来与各科技期刊社(编辑部)维护相互之间的关系,使各社(编辑部)对其增深了解、增进感情,赢取各社(编辑部)的信任和支持。
这一时期,各数据库商把主要精力放在数据库的内容建设上,通过各种方式争取更多科技期刊的收录直至独家收录。由于科技期刊社(编辑部)与数据库商的非从属关系,这个过程将是漫长、曲折的。实际上,早期一些英文版的科技学术期刊曾经被国内的这几家全文数据库所收录,随着它们投于Springer或Elsevier出版社麾下,它们所属的论文已经全部撤出中文数据库。那么,可以想象得到,如果要做到像国外一样,全部科技期刊独家收录,中国的全文数据库将经历一场痛苦的重组。
中文科技期刊数据库的发展也面临着诸多挑战。
首先,是来自国外科技期刊数据库的挑战。虽然随着我国科技实力的不断增强和科研人员数量的不断增多,各科技期刊的稿件资源比较充沛。但由于国外科技期刊影响力大,大部分国内科研人员的优秀稿件都被国外期刊吸引过去,这一现实直接影响了国内科技期刊的质量,进而间接影响了中文科技期刊数据库的质量。
其次,一些先进的出版理念也给科技期刊数据库甚至整个出版行业带来挑战,如OA出版。OA出版理念是一种新的出版理念,并在实践中被积极探索。OA是OpenAccess的缩写,国内翻译为开放存取或开放获取。其倡导为促进学术交流而进行文献的免费获取。OA文献的出版是通过一些官方机构及非营利组织建立的开放存取网站或其他形式的出版物,出版成本一般由作者、政府及出版机构等提供。目前,已形成一些有较大规模的网络OA出版项目,如美国学术出版与资源联盟项目(SPARC)、科学公共图书馆项目(PLoS)等。国内也有一部分高校学报实行免费全文下载,教育部科技发展中心所建立的科技论文在线网站也已颇具规模。这种新的出版模式无疑将挑战现有的科技期刊数据库的利益链条。
三、关于中文科技期刊全文数据库发展的思考
数据库资源的争夺自始至终无论在国内国外都在进行着,但国外的竞争多是在稿件(上游)资源的争夺上,而国内则是在期刊(下游)资源收录的争夺上。因此,中文科技期刊数据库的各服务商必须在合理处理与各科技期刊社(编辑部)的关系上多下工夫。尤其重要的是,各数据库服务商和各科技期刊社(编辑部)要有明确定位。
首先,数据库服务商定位。
针对中文科技期刊数据库的特点,数据库服务商要合理定位,结合自身优势,发掘数据库自身特色。一定要认识到数据库向精专细化发展的大趋势,例如做好某些学科期刊的数据库,专门收录某一学科的期刊。另外,要密切联系各中文科技期刊社(编辑部),争取收录更多的优秀刊物;同时,要把握市场规律,积极探索合理的市场化道路。积极开拓国内外市场,扩大数据库在国内外市场的影响力,这不仅能为数据库商带来更多的利润,而且也为中文科技期刊扩大影响力作出贡献,这将是中文科技期刊社(编辑部)在是否接受被该数据库独家收录时所考虑的一个重要因素。另外,必须明确把独家收录作为数据库收录的原则,不能一味迁就期刊社,必要时必须摈弃违反原则的期刊入库。实际上,各全文数据库必须明确意识到,放弃部分期刊,是势在必行的事情,除非有哪家数据库全面倒闭,不然你总得有所舍弃,让所有的数据库都能生存下去。
其次,中文科技期刊自身定位。
中文科技期刊的自身定位是中文科技期刊数据库发展的另一个关键环节。各期刊必须充分了解全文数据库收录的原则和版权的重要性,要形成关于数据库独家收录的统一认识。要结合本刊的办刊宗旨,从提高刊物质量和影响力的角度进行思考。不要盲目服从于被动的收录,应在认识到数据库收录重要性的基础上与各个数据库进行积极沟通,从而解决刊物是否要被收录、需要被具有何种特色的数据库收录以及收录方式等问题。
再次,政府在加强针对数据库发展的法制建设,规范数据库的发展,为数据库发展提供系列、持续的指导意见也是必不可少的。
政府有关部门应该积极探讨,协调各方利益关系,使我国的中文科技期刊数据库形成科学良性的发展和有序合理的竞争,避免资源的浪费。其中引入市场机制和制定相应法律法规是重要的手段。可喜的是,数据库发展这种无序竞争、政企不分、以权代法所带来的不良社会影响,已引起国家有关部门的高度重视,并相继出台了一些政策法规。强调“激励创造、有效运用、依法保护、科学管理”。引导各数据库商遵纪守法,有序竞争,自由重组。实际上,据我们上面的分析,数据库的调整、合并、重组,应该是不可避免的。
值得提到的是:中国科技论文的各大数据库已经意识到上述的问题,一些措施正在逐步酝酿或实施中,例如合并调整,收录期刊精专细化等等。
在科技期刊中,英文摘要决不是一个无足轻重的部分,英文摘要质量的好坏直接关系到论文是否能被SCI、EI、ISTP收录,因而英文摘要的撰写十分重要。国内学者对中文刊物的英文摘要有过不少论述,如:沈育英分别从时态、语态、常用句式、篇幅长短等方面对科技论文英文摘要应遵循的原则进行了归纳总结。方红列举了科技论文英语摘要的常见形式和常用句型。赵有斌从科技论文英文摘要的构成入手探讨了其语言特点。这些研究从不同方面对英文摘要进行论述,在很大程度上对科技论文英文摘要的写作有指导意义。本文把重心放在句法的语体特征上(不讨论词汇的语体特征),因为对英文摘要的论述虽多,但对语体问题却鲜有提及,然而,任何写作都涉及到语体,科技论文英文摘要的语体就应当适合科技论文这一语域,这种语体应当是正式的、简洁的、明确的、语义浓缩的。张德禄先生就将科技英语在句法上的语体特征归纳为三点:第一,被动语态的使用频率高;第二,名物化成分多;第三,非谓语动词形式多。这里的“高”和“多”都是相对于普通语体而言。这些特点同样适用于科技英文摘要。本文通过使用统计手段将50篇中文期刊的英文摘要和50篇英文期刊的英文摘要的这三个语体值进行对比分析,有根据地指出其中的差异,分析其中的原因,提出改进的办法。
二、语体值的对比分析
本研究从2007-2008年国内外公开发行的科技期刊中随机抽取了100篇英文摘要,其中,中文期刊的英文摘要50篇,涉及理工、农业、电子技术与信息科学、经管等专业,包括《计算机工程》、《材料热处理学报》、《电工技术学报》、《农业工程学报》、《振动工程学报》、《航空动力学报》、《粉末冶金技术》、《建筑材料学报》、《工程力学》、《系统仿真学报》、《管理科学学报》等中文核心期刊。英文期刊的英文摘要50篇,主要是从剑桥科学文摘(CSA) 随机抽取的,包括:“Biomedical Materials”.
本研究参照程雨民先生的语体计量研究方法及其语体成分表,结合科技论文摘要中上述三个语体因素,将这些语体因素量化得到语体值。根据语体成分表,被动语态、名物化以及非谓语动词均为语体的正丰满成分(+1),因此出现一个被动语态记+1分,名物化与非谓语动词也这样操作,然后分别累计这三个语体因素的得分,再分别除以总词数,就得到了每一项的语体值。这样中文期刊英文摘要的50个语体值就组成一个样本,而英文期刊英文摘要的50个语体值就组成另一个样本,然后做这两个样本的独立样本t检验,看两者是否具有统计意义上的显著差异,结果见以下各表。
如表1-1所示,在中文期刊的英文摘要中被动语态的语体值(3.5640)大于英文期刊的英文摘要中被动语态的语体值(2.8306),对这两组语体值进行平均数差异性t检验,结果如表1-2所示样本的方差齐(P=.250>α:0.05),两组英文摘要中被动语态语体值有显著性差异(P=0.020
如表2-1所示,在中文期刊的英文摘要中名物化的语体值(1.4506)小于英文期刊的英文摘要中名物化的语体值(2.5576),对这两组语体值进行平均数差异性t检验,结果如表2-2所示样本的方差齐(P=.075>α:0.05),两组英文摘要中被动语态语体值有显著性差异(P=.000
如表3-1所示,在中文期刊的英文摘要中非谓语动词的语体值(1.7720)小于英文期刊的英文摘要中非谓语动词的语体值(4.0784),对这两组语体值进行平均数差异性t检验,结果如表3-2所示样本的方差不齐(P=.009
三、讨论
表1显示两组刊物的被动语态的语体值有统计意义上的显著差别。中文期刊英文摘要的语体值显著大于英文期刊的。在中文期刊中,有些英文摘要句句都是被动态,而且还出现如下严重失衡的句子,如:A strategy of feedback control optimization of stochastic dynamic systems via stationary response is proposed.这种头重脚轻,信息分布不均衡的句子不符合英文表达习惯,但在中文期刊的英文摘要中俯首即拾,英文句型是头轻脚重的,是正三角形的,是后续性的,而汉语句型恰恰是倒三角的,前置性的。受母语负迁移的影响,中国作者在写英文摘要时善于进行RL逆线性扩展。按照英文主述位信息结构来讲,主位提供的是旧信息,述位提供的是新信息,而这种句子结构的述位几乎没有提供任何实质的信息,而主位的信息负载量却过大,这种句式不符合英文表达习惯。其实汉语也很少使用被动态,只是英文摘要一般都是从中文摘要翻译而来,在中文摘要中使用的汉语无主句就被统统译为英文被动句,直接把动词甩到其他成分之后,然后给动词披上被动态的外衣。这其中的原因是大家在学英语时,对被动态形式的习得普遍是很好的,在使用时似乎没有什么障碍。再者是十九世纪以来直到第二次世界大战前,英文科技论文中非常流行使用被动态,在大学英语和研究生英语的教学中,对于科技英语写作,教师强调最多的就是被动语态的使用,并鼓励学生把能变为被动态的句子全变为被动态。被动态的使用必须兼顾句子的平衡以及主位和述位的信息连贯,否则就显得有些生硬了。中文期刊的英文摘要中存在被动语态滥用的情况,这不是让我们抛弃被动态统统转向主动态,也不是说被动语态这种语体因素丧失了它正式语体正丰满成分的地位。应该看到的是,英文期刊摘要中被动态的使用频率仍远远高于普通语类,被动语态仍然是语体正丰满成分。但必须要意识到国际主流英文期刊在时态使用上发生的变化,主动语态比过去更频繁地使用了。
表2显示两组刊物的名物化的语体值有统计意义上的显著差别,英文期刊比中文期刊更多地使用名物化。通过对比这100篇英文摘要可以看出不论是中文期刊还是英文期刊都较少使用复句,句子结构倾向于简洁,这是撰写摘要的一个原则,但中文期刊的英文摘要多使用一致式,即通常用名词体现过程的参与者,用动词体现过程本身,用形容词来体现事物的特征,这些动词短语、名词短语以及形容词短语在一致式中都没有经历浓缩的过程,词汇密度难以增大。较之汉语,英语属于浓缩性语言,往往使用较低级阶的句法单位,将意义浓缩在一个较小的单位里加以表达;而汉语取较高级阶的语法单位,将意义扩展成较高句法单位来表达。而名物化是英文实现意义浓缩的主要手段,是语法中产生词汇高密集度的主要来源。中国作者由于受到母语负迁移的影响,当语义需要扩张时往往断句另起,信息较为分散。事实上,名物化属于语法隐喻范畴,熊和刘(2005)指出二语习得中语法隐喻的个体发展遵循了从一致式到隐喻式的规律,也就是说要英语水平高的作者才会自觉自如地使用这种名物化的隐喻式。
表3显示了两组刊物的非谓语动词的语体值存在统计意义上显著差别,英文刊物中更频繁地使用非谓语动词结构而中文刊物则很少用这种结构。在中文期刊摘要中出现的非谓语动词结构通常是些约定俗成的表达,如:based on,according to,compared with等,较少使用分词作定语特别是分词作状语。产生这种情况的原因是汉语不是一种屈折语,形态特别是动词的形态稳定自足,无限定性和非限定性之分,往往使用连动和兼动式,不恪守动词形式的各种规范,如时态、语态、数等。由于母语负迁移的作用,中国人对英文句法的掌握往往遵从单句-复句-非谓语的发展路径,并且在复句这一层次就停滞不前出现化石化现象。
四、结语
由于科技语域的名物化、分词化与关系过程化的特点突出,科技语体的句法特点是名词词组庞大、复杂,但句子结构简单。本文通过分析两组摘要中被动态、名物化以及非谓语动词的语体值,证明了中文科技刊物和英文科技刊物在这三方面有显著性差异。为了和国际主流期刊接轨,在撰写英文摘要时应注意在句法方面提升语体的正式性、正丰满性。
参考文献:
[1].沈育英:《科技论文英文摘要的特点及写作》,《中国科技翻译》,2001.2。
[2].方红:《科技论文英文摘要写作》,《西安科技大学学报》,2005.3。
[3].赵有斌:《科技论文英文摘要的特点》,《中国科技翻译》,2001.1。
[4].张德禄:《功能文体学》,山东教育出版社,1998。
关键词: 科技文 翻译 功能翻译理论
1.引言
较之其他翻译文本,科技文本具有较强的专业性,译文要求兼顾精准性和规范性,这就对翻译工作者提出了更高的要求。在实际情况中,作为中西方科技活动交流的主要媒介,科技论文由于其较强的专业性,使得英译工作发展缓慢,无论是科技工作者还是专业翻译者,都很难保证译文质量,致使科技文英译水平良莠不齐,这与中国的科技迅猛发展之势形成落差,提高中文科技文献英译水平是适应中国科技“走出去”形势的当务之急。
具体而言, 科技文英译存在的主要问题是英译工作多着眼于单句词语、语句或语段层面上的翻译,如何将科技文英译兼顾句法(包括语句内部的词汇和语法)和篇章层面应作为研究重点。文本类型理论及翻译目的论为探索科技文英译技巧和策略提供了理论支撑。
2.功能翻译理论
功能翻译理论中最具影响力的德国学派整合了费米尔的目的论、赖斯的功能翻译批评理论、曼塔利的翻译行为理论及诺德的“功能加忠诚原则”。
其中,目的论现已成为功能翻译理论的核心理论之一。该理论将翻译阐述为承载着本身的目的,并通过冲破文化障碍促进文化间交流的行为。选择翻译方法或策略的标准在于翻译本身的预期目标。目的论是建立在目的原则、连贯原则、忠实原则基础上的[1]。
赖斯将语言学的文本功能理论迁移到翻译行为的研究中,提出了功能翻译批评理论。该理论建立在布勒的语言功能三分法基础上,将文本分为信息型、表情型、感染型和视听媒体型四种类型[2]。
翻译行为理论是目的论的深化与发展。从翻译过程出发,曼塔利将翻译阐释为一种“跨文化合作”的行为,认为其是有自身目的并注重结果的活动,翻译过程则是文化转化关联的交流过程;从翻译参与者行为及作用角度出发,曼塔利认为翻译并不是单纯的文字本身的翻译,而是通过翻译打破语言障碍,从而促进文化的交流[3]。
诺德的“功能加忠诚原则”是对功能翻译批评理论的补充,不仅强调翻译本身的功能,还重视翻译对原著及读者的忠诚。在此,“功能”指译文可以在目标语国家的文化体系中起到学术交流作用;“忠诚”指翻译既要忠实原著又要兼顾读者的语言习惯。这一理论给出了翻译过程中经常碰到的一些问题的具体解决方案,如哪些语句属于可以保留,而哪些属于必须保留并进行相应的改写。
综上,功能翻译理论内部主流理论相互联系、相互补充,系统解决翻译实践中遇到的问题。
3.功能翻译理论指导下的科技文的翻译
功能翻译理论的某些特征能够迎合科技文在句法翻译(包括词汇&语法)和整体篇章翻译方面的特点。
3.1词汇翻译
3.1.1动词名词化
与汉语动词使用的灵活性不同,英语中动词的形态改变有严格限制,动词名词化的方式在不影响原文意义的同时,有利于句子结构的精简。在忠实性原则指导下,科技文英译倾向使用名词化动词,以顺应目标语的表达习惯与文本特点。举例如下:
原文:……打造医疗旅游资源的品牌价值,开拓医疗旅游市场的规模,提升医疗旅游服务与产品的质量……
译文:…the building of brand value of medical tourism resources, the expansion of medical tourism market, the improvement of the quality of medical tourism services and products…(动词的处理在此加粗标注)
分析:原文中使用了多个并列动词,使得句子更加简短有力。翻译时应将这些动词名词化(“打造”翻译为“the building of”;“开拓”翻译为“the expansion of”等),以保证句子结构与层次的清晰性,更符合英文表达习惯。
3.1.2渲染词的省译
为增强语气,中文科技文通常带有很多中国特色的渲染词汇,是中国人独特思维方式的体现;然而,科技英语更关注文章的周密严谨,用简练的表达突出文章的重点信息。在翻译过程中,可以将渲染词省译。举例如下:
原文:……对我国医疗旅游资源的空间布局、特征、类型等更加深入地讨论……有利于医疗旅游资源的合理使用,大力提高我国医疗旅游资源的市场竞争力,有针对性地创新更多的医疗旅游产品……
译文:… the discussion of the spatial distribution characteristic and type of medical tourism resources, and the exploration of China’s unique medical resources are favorable to the use of medical tourism resources, the improvement of market competitiveness of China’s medical tourism resources, the creation of more medical tourism products…(省译部分加粗标注)
分析:原文中使用了很多渲染词,例如“更加”、“深入地”、“合理”、“大力”、“有针对性地”等,都采取了省译策略,使译文更加简洁易懂。
3.1.3术语的处理
科技论文专业性强,术语使用密度高,翻译应当关注术语表达的准确性。举例如下:
原文:该文主要运用了定性的研究方法,包含网络分析法、实地调研法、SWOT分析法等。
译文:Qualitative research method is the main method of this paper, including network analysis method, field research method and SWOT(Strength, Weakness, Opportunity, Threat) analysis method.
分析:对于专业人士而言,原文中的SW OT分析法不难理解,但是考虑到非专业读者的阅读体验,因此在括号中将各字母的含义表示出来。
3.2语法翻译与篇章翻译
语法翻译通常融于篇章翻译中,在此将二者结合阐述。较之其他文体,科技文英译应注意的语法点主要在于主动变被动的处理。根据相关统计,在科技文教科书中,大约有将近一半的动词使用了被动语态,而汉语中更习惯主动语态的使用。因此,为了使得译文读者更容易理解,在翻译过程中要对语态作适当的转换。举例如下:
原文:……制订合理的医疗旅游方案,深入挖掘我国医疗旅游的独特优势,并进行医疗旅游产品的设计与创新。
译文:… a reasonable medical tourism scheme is developed, the unique advantages of medical tourism are exploited, and medical tourism product is designed and created.
分析:由于原文较长,而且结构相对复杂,因此在翻译时首先进行了断句。在翻译后半部分时,将汉语中的主动语态转换成被动语态,将汉语主动语态“制订”翻译成英语被动语态的“is developed”,将汉语主动语态的“挖掘”翻译成英语被动语态的“are exploited”,将汉语主动语态的“设计与创新”翻译成英语被动语态的“is designed and created”。这种不具备感彩的翻译方式,不但能够客观地将原文的语态特点表示出来,还能够让科技文的信息功能更加明显。
4.结语
在功能翻译理论的指导下,翻译不仅仅是不同语言之间的转变,更是一种具备较强目的性的交际行为。在翻译过程中,应当使用合理的处理策略,将译文的信息功能充分体现出来,实现交际目标。科技文是一种专业性很强的、以内容表达为目标的信息文本,为了将科技文的功能体现出来,需要运用交际翻译的合理处理策略,在保持原文信息不变的前提下,按照实际语体的习惯与结构进行适当的调整、转换与删减,从而使得科技文翻译质量更高。
参考文献:
[1]杨瑛.功能翻译理论与科技英语文体翻译方法分析[J].陕西科技大学学报(自然科学版),2008(05).
模拟实验是一种重要的科学技术研究方法,已广泛应用于许多领域[1-3]。社会发展与人类进步,迫切要求研究者日益关注新模拟实验方法的探讨,以发现越来越复杂的科学技术问题的未知特性,更好地揭示其内在运行机制。同时,研究者在科技论文中如何有效展示其模拟实验方法产生的效果,对提升论文价值,突出研究成果的创新性有重要意义。为此,在论述基本模拟类型的基础上,以近年来航空航天领域的某些中文科技论文为主要案例,探讨模拟实验方法的最新进展特征,提出属性依赖法与现场依赖法,为解决更复杂的科学技术问题提供新思路。
一、模拟的类型
1.模拟的基本类型
模拟是以科学技术理论与实践为基础,在一定环境与条件下,将研究对象用其它手段进行模仿的一种实验方法。该方法不直接涉及研究对象固有的现象与过程本身,而是设计一个和该现象与过程相似的模型,并通过该模型间接地呈现出该现象与过程。模拟实验的目的主要是便于经济地检验、验证、再现、发现或揭示该现象与过程的特征、演变规律与内在机制。
模拟的基本类型有物理模拟与计算机模拟。
物理模拟是制作和某现象与过程相似的物理模型,并对该模型研究,获取该现象与过程的特征。
计算机模拟是利用计算机对某现象与过程进行求解、分析、判断以及图像显示等,得出该现象与过程的特征。计算机模拟有模型模拟和统计模拟两种基本方法。
2.模拟实验方法的进展特征
科学技术的发展,对许多航空航天系统有越来越严格的性能要求[4-7]。为探索性能的未知特性,实时评估与预测性能退化轨迹,科学技术研究已经从静态发展到动态、从线性发展到非线性、从确定性参数发展到不确定性参数、从不变性函数发展到多变性函数。面对这些新问题,现有研究所采用的模拟实验方法取得了许多进展。
以近年来航空航天技术领域的某些中文科技论文为案例,经研究发现,模拟实验方法的最新进展以依赖问题的属性信息和现场信息为特征,旨在求解动态、非线性、不确定性与多变性等复杂问题,根据对问题信息的依赖特征,将现有的模拟实验方法归纳为属性依赖法与现场依赖法。
二、属性依赖法
属性依赖法是基于属性、目标属性与层次属性等3个信息要素的模拟实验方法。
属性是问题的抽象刻画,表示问题的性质与关系。性质表示问题的固有特征,关系表示不同问题之间的性质传承与影响。
目标属性是期望得到的对问题属性的某种解答或认知。
层次属性是目标属性的分解,即将目标属性分解为若干个子属性。若子属性彼此独立,则称为同层次子属性;否则称为非同层次子属性。层次按从低到高的顺序分为多层,目标属性依赖于最高层子属性,最高层子属性依赖于次高层子属性,依次类推,直到最低层子属性。
根据目标属性的不同,属性依赖法又细分为同步进化法与层次进化法。
1.同步进化法
同步进化法是将问题分解成低一层次的多个彼此独立的子问题,用基本模拟方法逐个解决各子问题,最后融合出结果。这是一种化整为零、逐个击破、同步进化的方法。具体做法是,若目标属性是由多个低一层次的独立子属性综合构成,则可以根据各独立子属性的特征,进行子属性模拟,然后推断各子属性的模拟结果,使各子属性由低层次同步进化至高层次,获得目标属性特征。
例如,揭示航空发动机非线性动力学特征是相关领域的一个重要问题。为此,文献[7]综合现有方法的优点,提出一种振动耦合动力学模型,计算出系统非线性响应,并在两个航空发动机转子模拟装置上进行模态实验,发现计算结果与实验结果有很好的吻合性。
在这个案例中,非线性响应特征问题被分解为2个同层次的子问题,即理论建模计算与模态实验,2个子问题解答的融合是将计算结果与实验结果进行对比分析。可以看出,解决这2个子问题的实验模拟方法分别是物理模拟和计算机模型模拟,经过对2种模拟结果的对比检验,最终推断出航空发动机非线性响应的某些特征,为探索航空发动机非线性动力学特征提供了新思路。
2.层次进化法
层次进化法是将问题按属性层次由低到高地分解成多个前后有联系的子问题,用基本模拟方法逐步解决各子问题,最后直接得到结果。该方法的特点是化整为零、逐步击破、依次进化。具体做法是,若目标属性可以分解为多个彼此低一层次的关联子属性,则可以根据各子属性的特征,按照设计好的步骤,依次进行子属性模拟,逐步使属性由低层次向高层次进化,逼近目标属性特征。
例如,航空发动机的故障诊断技术对发动机性能的可靠性、维护性和保障性有重要影响。但是,现有研究主要关注故障诊断算法的有效性,尚未有效验证故障检测率、定位率与虚警率等指标,从而无法定量评价故障诊断系统性能。这里的问题是如何定量评价故障诊断系统性能?
为此,文献[4]将问题分解为混合卡尔曼滤波器组故障诊断理论,发动机故障诊断系统和故障诊断实验等3个不同层次的子问题。这3个层次的进化关系为:(1)用计算机模型模拟方法构建混合卡尔曼滤波器组,为发动机故障诊断系统奠定理论模型基础;(2)基于理论模型,针对民用涡扇发动机常见的4种故障,用物理模型模拟方法搭建发动机故障诊断系统,为故障诊断实验奠定基础;(3)基于故障诊断系统,用统计模拟法评价出发动机故障诊断系统性能的定量指标值。
在该案例中,依次解决3个子问题的实验模拟方法分别是计算机模型模拟、物理模型模拟和统计模拟,最终目标是实现故障诊断系统性能的定量评价,为工程实践提供了重要依据。
三、现场依赖法
现场依赖法是基于时间序列和参数序列的模拟实验方法,时间序列和参数序列统称为序列。时间序列是将某现象的某一个指标在不同时间上的各个数值按时间先后顺序排列而形成的序列,序列中的信息与时间密切相关。参数序列是由某现象的某些特征值构成的序列,序列中的信息与时间没有关系。
现场依赖法是指依赖于问题真实现场信息的一种模拟实验方法,其特点是,在模拟实验中有现场的实时信息输入、输出与交流,可以及时矫正评估与预测结果。按照现场实时信息特征,现场依赖法可以细分为时间序列依赖法与参数序列依赖法。
1.时间序列依赖法
时间序列依赖法是根据现场实时信息的输入时间序列来实施输出序列运行轨迹评估与预测的一种模拟实验方法。
不确定性的输入时间序列干扰会导致输出时间序列运行轨迹发生未知的非线性与多变性演化,通过将外界的真实或模拟真实的时序干扰输入模拟实验系统,获取输出时间序列的演化响应机制,及时预测与矫正其运行轨迹,可以为真实航空航天系统的可靠运行奠定基础。
例如,为揭示大气阻力导致卫星轨道衰减的机制,文献[1]构建了模拟实验系统,将地球扁率与大气阻力摄动影响作为输入时间序列,通过模型模拟输出轨道根数变化,获取卫星轨道高度衰减结果即输出时间序列。其中,依赖的现场实时信息是经模拟改进的用某卫星高精度加速度仪测量得到的大气密度数据。尽管热层大气密度数据呈现出明显的动态、非线性、不确定性与多变性时序特征,模拟轨道序列与卫星实际轨道序列仍然保持一致,发现了卫星运行轨迹演变的新特性,研究成果具有创新性。
2.参数序列依赖法
参数序列依赖法是根据现场实时信息的输入参数序列来实施输出序列运行轨迹评估与预测的一种模拟实验方法。
常见参数有刚度、阻尼、固有频率、压力、流量与温度等,多种参数的组合构成参数序列。模拟实验系统的参数序列取值应该与真实系统的参数序列保持一致,才能可信赖地实施输出序列运行轨迹评估与预测。
例如,文献[8]的卫星在轨微振动环境模拟实验,用物理模拟方法构建出低频弹性支撑装置,揭示出自由边界条件对卫星动力学特征的影响机制,为提高卫星在轨微振动地面模拟实验精度奠定了基础。其中,依赖的现场实时信息是微振动扰振,输入参数序列为激振力参数,输出序列为模拟卫星弹性体的模态相应。
四、结 语
基于科学技术问题的属性信息和现场信息特征,提出模拟实验的属性依赖法与现场依赖法,可以解决动态、非线性、不确定性与多变性问题,为模拟实验方法的发展提供新思路。
模拟实验方法归类为科学技术研究方法论,合理运用属性依赖法与现场依赖法可以有效地验证或再现研究对象的表现,揭示其演变规律,发现某些未知特性。
在科技论文中,将属性依赖法与现场依赖法产生的效果充分展示出来,能更好地突出研究成果的创新性。
1.本科毕业论文实践中的计算机应用现状
1.1 计算机知识储备量不足
目前,各高校都开设有计算机课程,但仍不能满足本科毕业论文实践的需求。对于本科毕业论文,主要会用到Office办公软件中的Word、Excel、PowerPoint(PPT,Internet文献数据库,以及文献管理软件等。虽然各高校一般都开设有计算机基础类课程,介绍MicrosoftWindows、Office软件、Internet的使用,但所授内容还不能满足本科毕业论文实践的需要。在毕业论文写作时,毕业生往往感到Word文档的编排非常的麻烦,需要花费相当的精力和时间,也给指导老师增添了不少指导负担。同样,Excel、PowerPoint、Internet的使用也不尽如人意。除此之外,还有部分软件知识在已有课程中完全没有涉及,如文献管理软件的使用等。
1.2 计算机硬件设施不足
计算机资源不足严重影响毕业论文的撰写。学生可利用的计算机资源主要有三种:自有计算机,学校计算机,网吧计算机。对自有计算机而言,虽有调查表明大学生电脑的拥有率已达到50%左右,但对于大多数来自农村的大学生而言,他们的电脑拥有率依然很低。对学校计算机而言,虽然各学校都建立有计算机房,但相比于庞大的学生群体,学校计算机依然不能满足学生需求,而且学校计算机主要用于教学使用,学生的使用有时间限制。在这种情况下,许多学生不得不求助于网吧,而网吧一般不安装OFFICE办公软件,更不会安装如AutoCAD这种专业软件,也无法访问学校图书馆数据库。与此同时,毕业论文的撰写时间比较集中,往往在一两个月内完成,特别是临近答辩的几天里,几千毕业生需要计算机修订论文,计算机的紧张程度可想而知。因而,学生在毕业论文撰写过程中,常遇到没有计算机可以使用的情况。
1.3 计算机使用缺乏指导
学生进行计算机操作时,缺乏足够的指导。由于高校扩招,学生数量急剧增大而教师数量增加缓慢,导致师生比偏高,严重影响教学质量。作为公共基础课程,几千名学生的教学工作,往往由十多名教师来完成,师生比甚至高达1:250,很难说学生可以充分得到教师的指导在毕业论文进行阶段,也同样遇到师生比过高的问题,经常遇到一个老师同时指导十几名学生的现象,教师指导任务重,很难保证指导质量。
2.本科毕业论文实践中计算机应用需求
2.1 WORD大型文档编排
毕业论文是一种较长的文档,编排难度相对较大般而言,毕业论文字数要求5000字以上,页数一般在10页以上,编排的版式几乎与出版社正规出版的书籍类似。这对于平时很少利用Word软件的学生而言,具有很大的难度,需要重新学习Word的编排技巧。在论文写作过程中,也容易出现论文排版上的各种问题。
目前,文档编排软件很多,但一般采用Mi-crosoftWord完成.对于Word排版问题,应着重解决以下几方面的问题:①页面设置;②文字格式的设置;③样式的应用;④分节的设置;⑤页眉页脚的设置;⑥图表的绘制;⑦公式的录入;⑧自动生成目录。
2.2 Excel表、图与统计分析
对于大多数的毕业论文,都会涉及插入图表,以及数据的统计分析。除文科类论文较少涉及图表知识外,理工科、农科、医学等学科的大部分毕业论文,都会涉及图表的制作以及数据的统计分析。在毕业论文写作过程中,部分学生对图表的制作很是陌生,甚至不知道标准的图表要求是什么,因而做出来的图表不仅不美观,而且也不符合要求。Excel还具有统计分析功能,不仅方便快捷,而且准确可靠,但不少同学不知道Excel具有统计学功能,更不会使用。他们往往采用手算的方法来进行统计分析,耗时耗力,而且还容易出错。
图表与统计分析,不仅可以采用Excel,也可以采用更为专业的软件,如Origin制图、Sigmaplot制图、SAS统计分析、SPSS统计分析等,但以Excel更为方便。对于Execl图表与统计,应着重解决以下几方面的问题:①Excel表格的制作(特别是三线表的制作);②Excel图表的制作;③Excel函数与公式;④Excel统计分析工具。除此之外,也可以介绍Origin、Sigmaplot、SAS、SPSS等软件的使用。
文档演示毕业论文答辩时,_般采用PPT展示其研究课题。答辩过程主要包含两部分,学生陈述和老师提问。学生的自主陈述过程,不仅需要其精彩的陈述,更需要映衬陈述的多媒体展示。目前,大多数学生往往直接将论文内容粘贴到PPT当中,却不知如何精简和美化,结果导致PPT臃肿,条理不清晰,没有层次感。导致这一情况的直接原因就是学生缺乏PPT制作的技巧。
对于PPT的制作,应着重解决以下几方面的问题:①整体结构设计;②页面布局设计;③色彩搭配设计;④演讲内容提炼;⑤媒体元素设置;⑥动态效果设置;⑦播放策略。
2.4 INTERNET文献检索
Internet是获取科技信息非常方便的渠道。毕业论文的实践不是闭门造车,而是他人研究成果的继续。因而在研究之前需要查阅大量的文献。文献资料主要分为两种资料:文本资料和电子资料。大部分的研究成果是以期刊论文、会议报告、学位论文等形式最先展示出来的,而这部分资料目前基本都被相关数据库所收录,存储在数据服务器上。利用互联网技术,可以非常方便地查阅到所需要的资料。
对于Internet文献检索,应着重解决以下几方面的问题:①主要中文期刊数据库;②主要英文期刊数据库;③其它类型数据库(如:电子图书、电子报纸、会议论文、学位论文、标准、专利等);④检索策略;⑤检索技巧。
2.5 ENDNOTE文献管理
在毕业论文撰写过程中,根据撰写需要,要对参考文献进行插入、移动、删除等各种管理操作。本科毕业论文的参考文献数量一般在20篇左右,而研究生毕业论文的参考文献数量可达100篇以上,对于如此多的文献,如果采用人工管理的方式,不仅工作量巨大,而且非常容易出错。通过专业的文献管理软件,可以非常方便地对参考文献进行处理。文献管理类软件有多种,如:医学文献王、风^-express、Endnote、Referencemanager、Notefirst等。不同软件有自己的特点和优势,重点推荐Endnote文献管理软件,当然像Notefrst这种推出时间较短的国内免费软件,也有不错的口碑。
以Endnote文献管理软件为例,应着重解决以下几方面问题:①参考文献格式标准;②创建End-note图书馆;③文献信息录入;④Word中使用文献格式模板设置;⑥高级应用。
3.本科毕业论文实践中的计算机应用指导
3.1 加强计算机教育课程建设
通过调整课程设置和课程内容,引入相关计算机教育内容。同时,提高教学质量和水平,加强学生计算机实践能力的培养。在《计算机基础》课程中,要将Office办公软件引入到课程中,并要达到一定的应用水准。在《试验设计与统计分析》课程中,可以引入Excel和SAS等软件知识。在《文献检索》课程中,可以引入Internet的使用,数据库查询和Endnote软件等知识。在其它专业课程中,凡涉及到计算机内容的,也要尽可能进行上机训练,提高计算机应用能力。
3.2 加强计算机专业知识讲座
通过专题讲座的形式,讲解毕业论文实践过程中所使用的软件知识。在毕业论文撰写期间,可以通过专题讲座,具有针对性地进行辅导。因此,学生可以及时的了解相关知识,并立即加以应用。除了现场的讲座形式外,还可以利用网络的优势,建立网上学习平台,将学习资源放在网络上,学生可以随时查询相关计算机应用知识。
3.3 加强计算机硬件建设
加大计算机硬件设施的投入力度,优化计算机机房管理,提高计算机利用效率。根据学校人数和计算机使用的实际情况,合理投入资金进行计算机房的建设,增加计算机的台套数。其次,制定合理的管理措施,适当延长计算机房的使用时间,提高计算机房的利用效率,减少计算机的非学习性占用。
3.4 加强指导老师的指导职责
制定毕业论文指导教师的考核体系,强化指导教师的责任意识,督促教师加强对学生的指导。从学校和学院两个层次,学校层次要做好毕业论文指导的全面工作,同时要对计算机应用指导工作提出明确统_的要求,学院则有必要对学校的规定做出具体的安排和实施办法。
4.小结