时间:2023-03-16 16:27:42
序论:在您撰写多元统计分析论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
1聚类分析在证券投资中的应用
(1)定义:聚类分析是依据研究对象的特征对其进行分类、减少研究对象的数目,也叫分类分析和数值分析,是一种统计分析技术。(2)在证券投资中应用聚类分析,是基于证券投资的各种基本特点而决定的。证券投资中包含着非常多的动态的变化因素,要认真分析证券投资中各种因素的动态变化情况,找出合适的方法对这种动态情况进行把握规范处理,使投资分析更加的准确、精确。1)弥补影响股票价格波动因素的不确定性证券市场受到非常多方面的影响,具有很大的波动性和不稳定性,这种波动性也造成了证券市场极不稳定的发展状态,这些状态的好坏对证券市场投资者和小股民有着非常重要的影响。聚类分析的方法是建立在基础分析之上的,立足基础发展长远,并对股票的基本层面的因素进行量化分析,并认真分析掌握结果再应用于证券投资实践中,从股票的基本特征出发,从深层次挖掘股票的内在价值,并将这些价值发挥到最大的效用。影响证券投资市场波动的因素非常多,通过聚类分析得出的数据更加的全面科学,对于投资者来说这些数据是进行理性投资必不可少的参考依据。2)聚类分析深层次分析了与证券市场相关的行业和公司的成长性聚类分析是一种非常专业的投资分析方法,它善于利用证券投资过程中出现的各种数据来对证券所涉及的各种行业和公司进行具体的行业分析,这些数据所产生额模型是证券投资者进行证券投资必不可少的依据。而所谓成长性是一种是一个行业和一个公司发展的变化趋势,聚类分析通过各种数据总结归纳出某个行业的发展历史和未来发展趋势,并不断的进行自我检测和自我更新。并且,要在实际生活中更好的利用这种分析方法进行分析研究总结,就要有各种准确的数据来和不同成长阶段的不同参数,但是,获取这种参数比较困难,需要在证券市场实际交易和对行业和公司的不断调查研究中才能得出正确的数据。因此,再利用聚类分析法进行行业和公司分析和证券投资分析时要注重选取正确的、关键的指标进行检查,例如主营收入增长率、净利润增长率等指标,这样才有利于正确预测证券市场上股票的发展潜力。3)在实际操作中更加直观实用聚类分析是根据现代证券市场发展水平和特点发展出来的新的分析方法,这种分析方法的出现与现代的基本的投资组合理论形成了比较,突出了聚类分析方法更加贴近实际生活,更加直观、实用的特点,并且由于技术的发展,聚类分析方法在实际应用中所受到的局限较小,而且易操作,因此它的适用范围就比现资理论更加的广泛。
2主成分分析在证券投资中的应用
(1)定义:在统计分析中,主成分分析是一种分析、简化数据集的技术。主成分分析经常用减少数据集的维数,同时保持数据集的对方差贡献最大的特征。主成分分析由卡尔•皮尔逊于1901年发明,用于分析数据及建立数理模型。其方法主要是通过对协方差矩阵进行特征分解,以得出数据的主成分(即特征矢量)与它们的权值。(2)主成分分析的应用非常广泛,判别分析的分析方法就是通过对各种分类数据的研究,分析出自变量各组间存在的差异,并总结出差异性,判断哪一个自变量对组间差异的贡献是否完全,根据这些数据将自变量的转变方法进行样本归类。1)降低影响证券投资市场变动的因素之间的互相影响在证券市场中有非常多的因素在影响着证券市场的稳定,这些因素之间有着非常多的关系,相互影响、相互关联,但相互之间的影响也存在着非常多的影响。而主成分分析方法就是在对影响证券投资相互关系的因素中进行分析,并对原始数据指标变量进行认真分析,将其中重要的主成分因素概括出来,并进行转换形成相互彼此相互独立的成分,而且经过实践证明在影响证券市场投资分析中的指标间相关程度越高,主成分分析效果越好。2)通过主成分分析减少指标选择的工作量主成分分析的目的就是要通过对各种数据、因素的分析总结出相对各种因素的不同影响程度,总结总体因素中的主要影响成分,并总结出不同层次的影响因素梯度,在分析时采取逐级分析的方法,这样既可以抓住主要矛盾进行分析,也可以节省时间,并且提高分析的准确性,减少分析人员的工作量,因此,主成分分析法指标选择上的优势更加的突出。3)由主成分分析法构造回归模型更加的精确、节省时间在进行证券投资因素分析时,为了能够更加清晰准确的对模型中的相关数据进行分析,都要对各种数据进行模型处理,这样的处理方式可以提高整个证券投资分析的准确性,是模型更加易于做出结构分析、控制和进行证券市场变动的预报。
3因子分析
(1)定义:因子分析是指研究从变量群中提取共性因子的统计技术。最早由英国心理学家C.E.斯皮尔曼提出。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。(2)应用因子分析最主要的作用是确定证券投资组合的模型。因子分析将影响股票价格的各种因素看成是不同的变量,建立股价因子模型,利用各因子不相关性确定股票的分类,再分析股票的发展潜力的基础上确定出合适的证券投资模型。
4总结
主成分分析法,又称主分量分析法是指相关的经济变量间通常存在着起主导作用的决定性因素,通过对原始变量的相关矩阵内部结构进行分析,找出几个不相关的综合指标来线性表示原来的变量,主成分之间既互不相关,又尽可能多的包含了原指标集合。这种方法首先由Hotelling提出,其主要思想是降维。Stone(1947)对美国1929-1938年间的17项国民经济统计指标进行主成分分析,发现完全可以用三个经济指标来概括原来的17项指标,大大简化了数据分析。M.Scott(1961)对英国157个城镇的发展水平进行主成分分析,发现原57个测度指标完全可以由5个综合变量替代,既解决了原指标间的信息重叠问题,又简化了原指标体系的指标结构,主成分分析由此推广。邱东(1990)系统阐述了主成分分析法的定义、基本思想、基本步骤和特点,认为主成分分析法可以消除评价指标间的相关影响,并且伴随数学变换过程生成信息量权数和系统效应权数,保证了客观性。同时也指出了主城分析法在计算综合评价值未充分考虑指标的重要程度等不足,主要适用于被评价对象较多的综合评价。随后,众多学者对此提出了改进:孟生旺(1992)针对原始数据的标准化处理和主成分个数的选择问题,认为标准化不如均值化的无量纲处理方法,提出了非标准化主成分分析法。陈述云等(1995)通过对原始数据作对数—中心化转换,用原始变量的非线性组合表示主成分,同时重点分析样本协方差矩阵而非相关系数矩阵,提出了非线性主成分法。朱泰英等(2004)提出了加权主成分分析法,认为可以将主成分分析法的客观分析和层次分析法的主观分析有机结合。王璐等(2006)在对主成分分析法的权数、降维等问题的研究上,提出了首先要按主成分分析法对指标体系进行分类,得到各方面的评价值后再进行主成分分析,最终得到综合评价值的二重主成分分析法。段力誌等(2009)在传统主成分分析法基础上,首先对原始指标值进行预处理,再借助软件,将原始数据转化为少数几个主成分的线性组合,并进行加权变换,得到改进的主成分综合值。白雪梅等(1995)则分析了“均值化”、“标准化”、“极差正规化”三种方法的选择条件是保证方差损失最小。陈衍泰等(2004)认为主成分分析法具有全面性、可比性和客观合理性等优点,比较适合对评价对象进行分类,但需要大量数据,函数意义不够明显,不能反映客观发展水平。苏为华(2012)提出经典的R型主成分本质是单项指标标准化结果的加权算术平均值,比当量平均法复杂。赵利等(2013)通过主成分分析法对宏观经济中影响城镇劳动就业因素分析时,提出主成分为宏观经济和技术进步,通过VAR模型对主成分进行分析,得出宏观成分中对城镇劳动就业影响最大的是消费、产业结构和城市化水平,而技术进步成分中影响最大的是技术进步的结论。黄利文(2013)针对主成分分析中存在的未考虑负向因子的影响,以及采用线性加权法时确定权重方法不统一,评价结果非唯一等缺陷,提出了逼近理想点的主成分分析法,更好地反映了原始数据信息,并较为客观地给出了综合评价结果。林海明等(2013)认为主成分分析因缺乏应用条件的考虑而导致评价结果不具合理性甚至错误,通过分析因子分析法因子载荷阵的简单结构、加权算术平均数的合理性,得出主成分分析的应用条件是:指标是正向、标准化的;主成分载荷阵达到更好的简单结构时,主成分正向,且主成分与变量显著相关。
二、因子分析
法因子分析法是指从被评对象的观察变量的相关度出发,利用降维的思想,把繁杂的变量尽可能归纳为几个综合因子进行分析的的一种多变量统计分析方法。其基本思想是:将观察变量按相关度的高低或联系的紧密程度进行分类,类别内部变量相关性高,联系紧密,而类别之间的变量则相关度较低,联系稀疏,每一类变量则代表一个公共因子。具体步骤为:
三、逼近理想解的排序法
关于医学论文数据、资料的统计分析方法,总结如下:
1.定量资源
对于定量资料,应根据所采用的设计类型、资料所具备的条件和分析目的,选用合适的统计分析方法,不应盲目套用t检验和单因索方差分析;
2.定性资源
对于定性资料,应根据所采用的设计类型、定性变量的性质和频数所具备的条件以及分析目的,选用合适的统计分析方法,不应盲目套用X-检验;
3.回归分析
对于回归分析,应结合专业知识和散布图,选用合适的回归类型,不应盲目套用简单直线回归分析,对具有重复实验数据的回归分析资料,不应简单化处理;
4. 多因索、多指标资料
关键词:多元统计分析;教学内容;教学方法
中图分类号:G424.21 文献标识码:A 文章编号:
多元统计分析是统计学中的一个重要分支,是收集、处理和分析多维样本数据的统计方法。特别是随着计算机技术的发展,计算软件的普及,多元统计分析已成为分析多元数据的一个重要工具,在自然科学、管理和社会科学、经济领域等都有广泛的应用。
多元统计分析是我校财经管理类本科生大部分专业的一门必修课程,总学时为45学时,其中理论教学时数36学时,实践教学时数时。该课程涉及到许多数学知识,有大量的理论和公式推导,且计算量比较大。同时,本课程的学生为财经管理类的本科生,大多数学基础不好,且学生基础差异较大,部分学生感觉本门课程学习有困难。本文根据本学科的特点和学生的实际情况,结合自己从事多元统计教学的实践和体会,提出几点思考,以供同行参考,共同探讨。
一、重视统计方法的应用
针对财经管理类本科生数学基础较弱的情况,在教学过程中,理论推导部分不必讲解过多,也不应该过分强调复杂的数学证明和公式推导。对于多元统计分析的每一种统计方法,重点阐述它们的统计思想,结合实例介绍涉及到的背景,在实际应用中需要解决什么问题,如何用这种统计来解决这些问题,用了这种统计方法后可以得到什么结果。以及各种方法应用的前提条件、适用范围和局限性等,教学重点从理论转移到实际应用中。为了加深学生对概念的理解,适当做一些数学推导,可以省略复杂的证明。例如在聚类分析的教学中, 借助“物以类聚,人以群分”的道理给出了“就近原则”, 聚类分析的基本思想就容易被学生接受, 然后再逐步引入为了实现就近原则的度量远近的距离及各种具体聚类方法。学生在短时间内就对统计方法有了理解,效果非常明显。
二、重视各种多元统计方法的联系
各种多元统计分析方法虽各自具有不同的特点,但它们彼此之间均有着紧密的联系。在解决实际的问题中,也需要用多种方法结合起来解决问题,对于这一点一定要讲清楚。在聚类分析和判别分析的介绍中,我们介绍了在度量工具选择上两种方法的共同点。同时,聚类分析与判别分析有以下的不同点:①聚类分析可以对样本进行分类,也可以对指标进行分类;而判别分析只能对样本进行判别归类;②聚类分析事先不知道事物的类别,也不知道应分几类;而判别分析必须事先知道事物的类别;③聚类分析直接对样本进行分类,而判别分析根据训练样本建立判别函数,然后对新的观测对象进行判别归类。在实际问题处理中,针对聚类分析归类,判别分析分类的特点,常常将两种统计方法结合使用。在因子分析的基本思想、数学模型、因子载荷矩阵的估计方法、因子得分等几个环节的学习中, 我们随时将主成分分析的相关内容拿来与之比较分析, 分析了两种方法在模型、参数唯一性、取舍因子等问题上的不同与使用环境等方面的共同之处, 学生不仅对因子分析有了深入理解,而且对主成分分析的内容有所复习,更容易实现对着两种统计方法的掌握。
三、重视统计软件地使用
各种多元统计方法解决的是大量多维数据的分析问题,自然离不开复杂数据的计算,所以在教学中必须重视统计软件的学习,完成大量的计算过程。SPSS软件简单易学,操作方便、功能强大、应用广泛,可以进行大部分多元统计分析方法的操作,基本能满足教学和实践上计算的需要。且在多元统计分析课程之前,学生已学过SPSS课程,对软件的应用也基本掌握。在教学过程中,当介绍每一种统计方法的基本思想、原理后,先对教材上的已有详细步骤和结果的例题进行操作,使学生将统计软件操作结果与其进行比较。进一步要求学生针对某一专题或结合自身专业,对某一实际问题收集数据,整理数据,利用软件进行具体分析操作,得到自己需要的结果。但是在教学过程中,需要让学生知道统计软件只是一种分析工具, 重点还是掌握各种统计分析方法的基本原理和科学选用上。同时,结合自己的一些研究课题,与学生一起探讨、研究,培养学生初步的科研能力。
四、合理制定考试方式和内容, 科学评定学生成绩
针对多元统计分析课程的特点,本门课程考核不仅要注重基本知识点的掌握,也要包括各种统计方法的理解、分析和应用。在考试的方式上,可以采用闭卷考试,开卷考试和课程论文相结合,从而多角度、全方位对学生的学习成绩给予综合评价。通过以上多种方式,考察学生理解能力、跨学科综合能力、解决实际问题的能力及创新能力。在考试的内容上,闭卷考试着重考查学生对各种统计方法和理论知识的掌握程度,并对量不大的数据进行处理;开卷考试以学生上机操作的方式进行,着重考查学生利用统计软件处理多元数据的熟练程度,以及对统计软件输出结果进行分析判断和解释说明的统计素养;课程论文侧重于考查学生运用多元统计方法解决实际问题的能力及创新能力。总成绩则有闭卷考试成绩(占60%)、开卷考试(占20%)和课程论文成绩(占20%)三部分组成,从而科学评价学生对本门课程的掌握情况。
多元统计分析作为多元数据处理的一个重要工具, 必将随着社会的需要而不断的有广泛的应用。多元统计分析教学模式的选择必须根据教学的需要和学生的实际接受水平发生改变。而作为教师,需要不断地总结经验,完善自己的教学,不懈努力,传授给学生正确的统计思想, 实用的统计方法和综合的统计能力。
参考文献:
1何晓群. 多元统计分析[M]. 中国人民大学出版社,2012.
2任雪松,于秀林. 多元统计分析[M]. 中国统计出版社,2011.
3苏金明,傅荣华等. 统计软件SPSS系列应用实战篇[M]. 北京: 电子工业出版社,2002.
4张文彤,邝春伟.SPSS统计分析基础教程[M]. 北京:高等教育出版社,2011.
5吕洁. 多元统计分析课程教学探讨[J].中国成人教育,2007 ( 8): 153- 154.
6陶胜,胡明颖. 多元统计分析课程教学研究与实践[J]. 集美大学学报, 2011( 2): 99- 102.
2012年12月份,我国生产化学农药原药(折百)34.2万吨,同比增长9.97 %。2012年1-12月,全国的产量达35
>> 2014年全国化学农药原药产量情况 统计局:2013年11月我国化学农药产量同比增长2.79% 2012―2015年我国煤矿瓦斯事故统计分析 2008年~2012年我国高校档案学研究生统计分析 2000—2012年:我国教育技术相关著作统计分析 1998年-2008年我国网球硕博论文统计分析 我国媒介融合研究统计分析 我国能源结构的统计分析 近30年我国综合档案馆研究论文统计分析 2002年~2011年我国“弃档”现象研究论文的统计分析 2005年~2015年我国档案安全应急预案研究文献统计分析 《档案管理》2012年载文统计分析 2012年我中心门诊使用抗高血压药物统计分析 1985~2007年我国国际竞争力论文的统计分析 19877―20166年我国档案法规研究期刊论文统计分析 2013年10月中国化学农药产量同比下调6.08% 基于多元统计分析的我国各省级区域经济分析 USPTO中我国专利引用状况的统计分析 FDI与我国经济增长之间关系的统计分析 我国入境旅游人数统计分析与模型预测 常见问题解答 当前所在位置:中国 > 科技 > 2012年我国化学农药原药产量统计分析 2012年我国化学农药原药产量统计分析 杂志之家、写作服务和杂志订阅支持对公帐户付款!安全又可靠! document.write("作者: 本刊编辑部")
申明:本网站内容仅用于学术交流,如有侵犯您的权益,请及时告知我们,本站将立即删除有关内容。 2012年12月份,我国生产化学农药原药(折百)34.2万吨,同比增长9.97 %。2012年1-12月,全国的产量达354.9万吨,同比增长19%。 从各省市的产量来看,2012年1-12月,江苏省化学农药原药(折百)的产量达105.58万吨,占全国总产量的29.75 %。紧随其后的是山东省、浙江省和湖北省,分别占总产量的23.25 %、8.47 %和8.34 %。 杀虫剂原药产量同比下降11.96% 2012年12月份,我国生产杀虫剂原药7.92万吨,同比下降29.36 %。2012年1-12月,全国的产量达81.34万吨,同比下降11.96 %。 从各省市的产量来看,2012年1-12月,湖南省杀虫剂原药的产量达24.93万吨,占全国总产量的30.65 %。紧随其后的是江苏省、山东省和湖北省,分别占总产量的29.53 %、9.22 %和8.94 %。 杀菌剂原药产量同比下降7.08 % 2012年12月份,我国生产杀菌剂原药14383.11 吨,同比增长1.86 %。2012年1-12月,全国的产量达143893 吨,同比下降7.08 %。 从各省市的产量来看,2012年1-12月,江苏省杀菌剂原药的产量达60458.42 吨,占全国总产量的42.02 %。紧随其后的是浙江省、安徽省和宁夏回族自治区,分别占总产量的13.92 %、9.39 %和8.74 %。除草剂原药产量同比增长42.55% 2012年12月份,我国生产除草剂原药16.27万吨,同比增长40.74%。2012年1-12月,全国除草剂原药的产量达164.79万吨,同比增长42.55%。 从各省市的产量来看,2012年1-12月,山东省除草剂原药的产量达67.13万吨,同比增长88.65%,占全国总产量的40.74%。紧随其后的是江苏省、浙江省和湖北省,分别占总产量的20.41%、10.27%和9.18%。(摘编自《中商情报网》)
论文关键词:R软件,聚类分析,主成分分析,典型相关分析
引言:多元统计分析是统计学的一个重要分支,也称多变量统计分析;在现实生活中,受多种指标共同作用和影响的现象大量存在,多元统计分析就是研究多个随机变量之间相互依赖关系及其内在统计规律的重要学科,由于多元统计分析方法一般涉及复杂的数学理论,一般无法用手工计算,必须有计算机和统计软件的支持。
在统计软件方面,常用的统计软件有SPSS、SAS、STAT、R、S-PLUS等。R软件是一个自由、免费、开源的软件,是一个具有强大统计分析功能和优秀统计制图功能的统计软件,现已是国内外众多统计学者喜爱的数据分析工具。本文结合实例介绍了R软件在多元统计分析中的应用,具体内容包括R软件在聚类分析、主成分分析、对应分析等方面的应用。
一 在聚类分析教学中的应用
聚类分析又称群分析,它是研究(样品或指标)分类问题的一种多元统计方法,所谓类,通俗地说,就是指相似元素的集合。在社会经济领域中存在着大量分类问题,比如若对某些大城市的物价指数进行考察聚类分析,而物价指数很多,有农用生产物价指数、服务项目价指数、食品消费物价指数、建材零售价格指数等等。由于要考察的物价指数很多,通常先对这些物价指数进行分类。总之,需要分类的问题很多,因此聚类分析这个有用的工具越来越受到人们的重视,它在许多领域中都得到了广泛的应用。
聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等,具体详见参考文献[3]。
R软件及其相关包提供了各种聚类方法,主要是系统聚类方法、快速聚类方法、模糊聚类方法,常用的是系统聚类方法。
R软件实现系统聚类的程序如下:
Hclust(d,method=“complete”)
其中d是由“dist”构成的距离结构,具体包括绝对值距离、欧氏距离、切比雪夫距离、马氏距离、兰氏距离等,默认为欧氏距离;method包括类平均法、重心法、中间距离法最长距离法最短距离法、离差平方和法等,默认是最长距离法。
例1 下表是山东省2008年各市居民家庭平均每人全年消费性支出,利用所给数据对各市进行系统聚类。
山东各市居民家庭平均每人全年消费性支出 元/人
地区
食品
衣着
居住
设备用品
交通通讯
文化教育
医疗保健
其它
济南
1628.16
252.86
790.11
285.64
634.83
355.54
394.37
43.9
青岛
1999.61
523.76
901.56
297.76
595.34
618.12
260.17
106.42
淄博
1691.6
372.21
844.44
300.46
494.67
580.6
370.84
102.16
枣庄
1370.59
272.95
614.3
227.52
454.73
245.93
220.88
84.2
东营
1580.86
234.17
813.58
253.12
532.19
432.05
275.3
39.1
烟台
1673.19
337.92
719.28
201.3
414.08
497.57
286.03
77.11
潍坊
1516.36
299.67
1327.72
243.72
583.04
494.65
269.82
92.95
济宁
1375.4
287.17
722.05
282.16
380.68
412.42
218.11
56.94
泰安
1412.44
225.66
567.66
257.96
411.98
450.57
177.02
70.07
威海
1684.64
517.59
759.36
227.12
424.41
565.75
444.31
77.48
日照
1451.12
351.21
562.91
208.81
457.2
332.16
182.2
37.69
莱芜
1516.22
198.94
624.72
207.03
464.06
469.35
256.53
36.33
临沂
1339.69
212.36
625.26
191.34
409.39
314.9
156.01
63.31
德州
1114.47
173.88
553.14
169.23
319.41
220.45
137.97
42.2
聊城
1146.53
182.53
566.92
186.05
317.48
332.64
155.94
54.31
滨州
1177.49
179.96
979.01
206.88
451.85
407.49
298.7
47.51
菏泽
1265.03
170.85
550.68
143.11
329.99
349.41
Abstract: According to the university scientific research data in nearly ten years, the factor analysis and cluster analysis statistical methods in the multivariate statistical analysis are used to carry out the comprehensive evaluation analysis of the college scientific research status and put forward a method for evaluating the state of the research. Research shows that, in some colleges, the first factor is very high, indicating that these colleges in cutting-edge academic research achievements. But at the same time, the third factor is low, indicating that these colleges and enterprises to contact the lack of scientific research. In other colleges, the second factor is very high, indicating that these colleges in the per capita contribution rate, C class paper per capita contribution rate and other aspects to do better. In addition, some of the college's third factor is very high, indicating that these colleges are closely related to the enterprise's scientific research and cooperation. The results of the subsequent cluster analysis also confirmed the rationality of the conclusion of the comprehensive evaluation analysis. Through the study of this paper, it provides a theoretical basis for the scientific management system and evaluation system of scientific research achievements.
关键词: 高校;科研状况;因子分析;聚类分析;评价
Key words: colleges and universities;research status;factor analysis;cluster analysis;evaluate
中图分类号:G463 文献标识码:A 文章编号:1006-4311(2016)31-0015-04
0 引言
科研能力是衡量一所高校科教水平的重要标志。某高校作为省重点高校有着悠久的办学历史,科研水平在省内也是名列前茅,本文针对该高校20个学院的各项科研指标进行多元统计分析,建立了描述科研水平的各类变量,包括各类科研项目的经费总额、各类论文的发表数量、论著发表数量,投入科研人员数量等。但由于各学院规模不一,各学院科研性质也不尽相同,为了保证研究结果的平衡性,本文采用对科研成果人均贡献率的方式进行研究。然而进行统计分析时,并非变量收集的越多越有利,变量间信息的高度相关、高度重叠会给统计方法的应用带来许多困难,因此本文借助SPSS统计分析软件,采用因子分析方法,在众多变量中提取影响各学院科研状况的主要因子对问题进行分析,最后通过因子变量的聚类分析对评价结果进行验证。国内学者目前主要集中对我国体育事业进行科研状况分析,如贾志强、郑岩平对我国1995-2000年篮球科研状况作了分析。张金、夏秀荣对我国1994-2003年排球科研状况作了分析。在高校科研状况分析方面,孟学英、陈春华利用调查问卷方式对我国部分高职院校教师科研状况做了调查分析。同时国内对多元统计方法的应用也主要集中在医疗、经济方面,如孟莹、谢守祥等利用多元统计分析方法对江苏省经济差异化做了分析。王曦、宋剑南利用多元统计分析方法对影响中医症候的主要因素做了研究。利用多元统计分析方法结合高效科研状况评价分析还鲜有研究。本文结合多元统计分析分析方法对某高校科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。
1 因子分析方法简介
因子分析是利用降维的思想,由研究原始变量相关矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性较高,而不同组的变量之间的相关性则较低。每组变量代表一个基本结构,并用一个不可观测的综合变量表示,这个基本结构就称为公共因子。对于所研究问题的某一具体问题,原始变量可以分解成两部分之和的形式,一部分是少数几个不可测的所谓公共因子的线性函数,另一部分是与公共因子无关的特殊因子。进行因子分析的步骤如下:①根据研究问题选取原始变量。②对原始变量进行标准化并求其相关阵,分析变量之间的相关性。③求解初始公共因子及因子载荷矩阵。④因子旋转。⑤因子得分。⑥根据因子得分值进行进一步分析。
2 各学院科研状况的因子分析
2.1 数据分析和指标选取
本文选用的数据来源于某高校2006年至2015年的统计数据。设定数据中8个指标变量分别是X1:2006-2015年横向项目金额人均贡献率(万元/人);X2:2006-2015年市校级项目金额人均贡献率(万元/人);X3:2006-2015年省部级项目金额人均贡献率(万元/人);X4:2006-2015年国家级项目金额人均贡献率(万元/人);X5:A类论文人均贡献率(篇/人);X6:B类论文人均贡献率(篇/人);X7:C类论文人均贡献率(篇/人);X8:论著数量人均贡献率(项/人)。数据详情见表1。
在进行数据分析前,进行KMO检验,P值为0.000,检验结果是显著的,同时KMO值达到0.577,结果见表2,表明数据之间具有一定的相关性,可进行因子分析。
从表3变量共同度表中可以看出因子分析的变量共同度均较高,表明变量中的大部分信息均被因子所提取,说明因子分析的结果是有效的。
2.2 因子提取和因子解释
现应用主成分分析法来进行因子提取和因子个数的确定,从表4中可以看出只有前三个因子特征根大于1,并且前三个因子特征值之和接近80%,故提取前三个因子基本包含了全部测评指标的绝大部分信息,因子分析效果较理想。
由于初始载荷阵结构不够清晰,不便于对因子进行解释,因此对因子载荷矩阵实行旋转,达到简化结构的目的,使各变量在某些因子上有较高载荷,而在其余因子上只有小到中等的载荷。这里采用方差最大正交旋转法进行因子旋转。结果见表5。
从旋转后的因子载荷矩阵来看,第一个主因子在省部级项目金额人均贡献率、国家级项目金额人均贡献率、A类论文人均贡献率、B类论文人均贡献率上具有较高载荷,第二个主因子在C类论文人均贡献率、论著数量人均贡献率上具有较高载荷,第三个主因子在横向项目金额人均贡献率、市校级项目金额人均贡献率上具有较高载荷。
2.3 因子得分和因子变量
本文采用回归法估计因子得分系数,并输出因子得分系数矩阵见表6。
根据表6可写出以下因子得分函数:F1=-0.014横向项目金额人均贡献率-0.078市校级项目金额人均贡献率+0.263省部级项目金额人均贡献率+0.293国家级项目金额人均贡献率+0.178A类论文人均贡献率+0.508B类论文人均贡献率+0.021C类论文人均贡献率+0.174论著人均贡献率(1);F2=-0.159横向项目金额人均贡献率+0.065市校级项目金额人均贡献率+0.00省部级项目金额人均贡献率-0.057国家级项目金额人均贡献率-0.235A类论文人均贡献率+0.393B类论文人均贡献率+0.328C类论文人均贡献率+0.570论著人均贡献率(2);F3=0.442横向项目金额人均贡献率+0.582市校级项目金额人均贡献率+0.123省部级项目金额人均贡献率+0.010国家级项目金额人均贡献率-0.076A类论文人均贡献率-0.219B类论文人均贡献率+0.384C类论文人均贡献率-0.010论著人均贡献率(3)
通过上述公式(1)、公式(2)和公式(3)可得到各个学院的因子得分。从而获得三个因子变量,由于这三个因子变量是线性无关的。因此,可以利用它们对各个学院的科研状况做统计分析。
3 各学院科研状况的综合评价分析
下面利用三个因子变量对2006年-2015年该高校各学院科研状况做多元统计分析,并对各学院近10年来科研状况进行综合评价。
首先画出三因子变量的散点图,对各学院近10年来科研状况做对比分析。以第一因子变量为横坐标,第二因子变量为纵坐标,第三因子变量为竖坐标的三维散点图如图1所示。
从图1中可以看出P学院、O学院、M学院等的第一因子很高。说明这些学院在国家级项目人均贡献率、省部级项目人均贡献率、A类论文人均贡献率、B类论文人均贡献率上成绩突出,但在横向项目人均贡献率上稍显不足,这些学院应该在保持尖端学术科研的前提下,多加强与企业的合作,创造更多产业应用成果。L学院、R学院、N学院等的第二因子很高,说明这些学院在论著人均贡献率、C类论文人均贡献率上成绩突出,这与这些学院的科研性质是密不可分的,第二因子很高的学院可以在保持自己科研特色的前提下,多关注学术前沿的相关信息,争取在尖端科研中有更大的突破。如B学院、I学院等的第三因子很高,说明这些学院在横向项目人均贡献率上成绩突出,这些学院可以在紧密保持与企业的科研联系的基础上,加强自己在学科特色科研中的研究,多出一些基础研究方面的尖端科研学术成果,增强学院在科研创新中的能力。
最后利用系统聚类分析法对各学院科研状况进行聚类分析,即利用三因子变量对20个学院进行聚类,结果如表7所示,M学院、P学院、O学院和J学院为一类,B学院、I学院为一类,其它学院为一类。这个结果与散点图分析的情况基本类似。
4 结束语
本文针对某高校各学院科研状况进行综合评价分析,通过对高校近十年科研指标数据进行因子分析,将八个指标变量分为三个科研因子,分别是高端科研因子、校企合作科研因子、基础科研因子,并给出了因子得分模型,对各学院近十年的科研状况给出了分析,最终的聚类分析结果也对各学院科研状况做了验证说明。论文的研究成果为科学地建立高校科研业绩的管理体系及评价体系提供了理论依据。
从分析结果来看,因学院科研特色不同,导致各个学院在学术科研这个万花筒中所扮演的角色也各不相同,但各学院之间还是应当加强科研合作,取他人之长补己之短,这样才能为该高校向科研大校、科研强校的进军道路上打下坚实的基础。
参考文献:
[1]薛薇.SPSS 统计分析方法及应用[M].二版.北京:电子工业出版社,2006:303-349.
[2]张文彤.SPSS11统计分析教程―高级篇[M].北京:北京希望电子出版社,2002:166-210.
[3]李卫东.应用多元统计分析[M].北京:北京大学出版社,2008:226-240.
[4]阎慈琳.关于主成分分析做综合评价的若干问题[J].数理统计与管理,1998(2):22-24.
[5]胡永宏,贺思辉.综合评价方法[M].北京:经济科学出版社, 2000.
[6]何晓群.现代统计分析方法与应用[M].北京:中国人民大学出版社,2003,8:15-18.