学术期刊评价是图书情报机构、高校和学术机构以及相关政府管理部门长期给予高度关注的问题,因此,国内外学者围绕期刊评价开展了大量研究,取得了丰硕的成果。但是,对于主要是哪些因素决定了期刊的被引用,许多研究的结论迥异,而且对于国外学术期刊的研究结论是否适用于国内学术期刊,也有待验证。因此,本研究以国内生物学、物理力学、地质学期刊为对象,系统地探讨国内学术期刊的相关特征与被引之间的关系,为相关机构和部门的实践工作和管理决策提供依据。
1研究现状
现有学者对期刊特征和被引之间关系的研究主要集中在期刊载文量、基金论文比、论文合著者、引文特征、出版时滞等方面,具体如下:
(1)期刊载文量。Elizee等认为,随着互联网的发展和读者数量增加,用户可以更方便地获取论文,期刊载文量的增加可以提高期刊被引量。陈留院以36家师范大学学报(自然科学版)为例,发现期刊的学术影响力与载文量成正相关。刘岩等人的研究都得到了相似的结论。但是,也有研究者提出不同的观点。譬如,王钟健等以农业经济类期刊为样本的研究显示,期刊载文量的增加与期刊学术质量之间没有必然联系。
(2)期刊基金论文比。Shen等对ACMSIGIR、ACMSIGKDD两个国际会议论文的研究,以及Pqi等对2010~2012年WOS收录的自然科学论文的研究均表明,基金论文的学术影响力高于普通论文。戚尔鹏和叶鹰通过分析WOS数据收录的2010~2012年基础学科论文,发现除逻辑学以外,所有基础学科的基金资助引用优势为正,这表明基金论文的被引频次和影响力普遍高于非基金论文。刘睿远等人[10-12]的研究也支持了这一观点。但是,王谦等对中文医学核心期刊的研究和林丽芳对高校学报的研究却显示,基金论文比与期刊评价指标不完全具有相关性,基金论文与其学术影响力之间不存在必然联系。而徐晶等分析2007~2011年口腔医学类期刊基金论文的引用情况之后,指出基金论文比在一定程度上可以代表期刊质量,但是不能单纯依此评判期刊的质量。
(3)论文合著者。Glänzel和Thijs的研究发现,生物医学、化学和数学领域论文的平均引用率随着合作者的数量而增长;Leimu和Koricheva进一步指出,4个共同作者的平均引用率高于3个、2个或1个。钟镇以2004~2008年WOS图情学科研究型论文为样本,发现按照合著人数进行分组,图情学科4人合著论文的篇均被引频次最高,但合著者的数量与论文被引影响力之间不能划等号,合著作者数的提高未必能带来论文被引频次的提高。类似的,Glänzel和Schubert的国际合著研究也发现,相当一部分国际合著论文的被引绩效低于研究样本的平均水平。Abramo和Ange⁃lo的研究同样拒绝了作者数量与期刊影响力之间的正相关假设。论文合著研究除了作者之间的合作,还包括机构之间的合作。赵金燕发现,机构分布数与被引频次高度相关,对被引频次有较强的解释能力。盛丽娜也认为,用作者机构的分布情况评价科技期刊影响力优于使用影响因子和被引频次。
(4)引文特征。Biglu以SCI和WOS为数据源,发现期刊的引文量和被引量具有一定的线性关系。期刊的篇均引文量越大,相应的被引量也就越高,期刊引文量和期刊的被引量之间会形成“马太效应”。Didegah和Thelwall也认为适当数量的参考文献将提高其获得更多被引用的可能性。在国内,程慧平和万莉也持相同的观点,认为平均引文量表明了学术论文的研究起点和深度,可以反映论文的学术水平,而且周吉光等还提出,期刊引用半衰期衡量了期刊刊载文献的参考文献的时效跨度,期刊引用半衰期短,意味着该刊对较短期内发表的较新的研究文献的兴趣度。
(5)期刊出版时滞。Tsay等对医学期刊2000年JCR相关数据的研究发现,出版频次较高的期刊被引频次也高。Shen等人以Nature、Science、Cell三种期刊为对象的研究显示,期刊发文时滞与被引频次之间存在相关性。与此类似,Pautasso和Schäfer发现,生态学期刊平均编辑延迟天数与影响因子之间存在显著的负相关。但是,韩牧哲等对图书情报学中文核心期刊的研究却表明,虽然论文的影响力与其发表时滞的长短存在相关关系,具有能使论文影响力最大化的理想时滞区间,但是,发表时滞并非越短越好。同样,刘俊婉等以Scientometrics和《情报学报》为例,发现期刊论文的发文时滞与论文被引频次之间仅具有相关性趋势,但并不显著。综上,虽然已有不少研究分析了期刊特征与被引之间的关系,但是,在许多方面并未达成共识。为了准确地揭示国内期刊特征与被引之间的关系,从而有针对性地指导工作实践和管理决策,本研究在系统梳理现有期刊评价指标的基础上,提炼出11个期刊特征指标,分析它们与期刊被引之间的关系。
2数据获取与主成分回归分析
2.1数据获取
学术期刊论文效用的体现是一个逐步呈现的过程,因此,本研究以期刊后,5年内累计获得的被引用频次作为衡量期刊影响力和质量的指标。为了保证数据来源的一致性,我们以中国知网的《中国学术期刊影响因子年报》、《中国引文数据库》、《期刊发展要素统计分析》作为期刊特征指标和被引用数据的来源。具体如下:
(1)《中国学术期刊影响因子年报》:可被引文献量、可被引文献比、基金论文比、引用半衰期、引用期刊数;
(2)《期刊发展要素统计分析》:作者数、机构数、出版时滞、本刊比重、全国比重;(3)《引文数据库》:篇均引文量和总被引。由于中国知网最新数据统计截止到2015年底,所以,本研究采用生物学、物理力学、地质学三个学科,共218种期刊2011~2015年的被引频次,以及各刊2011年的特征指标。
2.2主成分回归分析
本研究运用因子分析提取原始特征指标的公因子,进而采用多元回归分析特征指标与被引之间的线性关系。数据分析使用SPSS20.0。
2.2.1因子分析
(1)KMO和Bartlett检验。结果显示,生物学、物理力学和地质学三个学科的KMO分别为0.699、0.726、0.683,Bartlett球形检验p值均小于0.001,所选变量适合做因子分析。
(2)贡献率和载荷矩阵。采用固定提取方法,生物学和物理力学提取出F1、F2、F3、F4、F5、F6六个主成分,地质学提取出N1、N2、N3、N4、N5五个主成分。这些主成分对生物学、物理力学、地质学期刊被引的累计贡献率分别为92.638%、92.712%、86.413%。
2.2.2回归分析
(1)模型拟合度R方检验。以被引为因变量,以因子分析提取的公因子为自变量,进行回归分析。结果显示,生物学、物理力学、地质学三个学科的确定系数R2分别为0.762、0.913、0.699,表明生物学和地质学回归模型拟合度较高,物理力学回归模型拟合度非常高。
(2)显著性检验。回归模型的F检验结果显示,生物学、物理力学、地质学三组样本的p值均小于0.001,具有统计学意义。
2.2.3贡献度分析
对回归方程进行偏回归系数t检验,以此为基础进行逐步回归得出具有显著相关性变量的贡献度。对回归方程进行偏回归系数t检验,结果表明:生物学中F1、F3、F6三个自变量的偏回归系数t检验p<0.05;物理力学中F1、F4、F6三个自变量的偏回归系数t检验p<0.05;地质学中N1、N2、N3、N4四个自变量的偏回归系数t检验p<0.05。同时,采用逐步回归法分别分析得出:生物学中F1的贡献度最大为62.9%,F3和F6的贡献度分别为5.7%和6.2%;物理力学中F1的贡献度最大为83.1%,F4和F6的贡献度分别为4.5%和2.1%;地质学中N1的贡献度最大为40.7%,N2的贡献度为18.1%,N3的贡献度为6.3%,N4的贡献度为6.5%。
3讨论
3.1强贡献度公因子
回归分析结果表明,F1(N1)公因子与被引显著相关,并且对被引有较高的贡献度。尤其是物理力学期刊,其贡献度高达83.1%。本研究支持了何荣利、王群英、赵金燕、Glänzel等人的研究结论,即载文量、作者数和总被引成正相关。期刊论文在文献传播过程中,作者数和发文机构数在一定程度上可以扩大论文的传播范围,使得其快速地被部分群体所认知,从而形成引用,提高期刊的被引频次。同样,引用期刊数反映了期刊的引用广度,体现了该期刊对相关学科的渗透和交融,引用期刊数越多越容易获得相关学科的关注和引用。F1和N1公因子均从可被引文献量、作者数、机构数、全国比重、引用期刊数五个原始变量中提取。五项特征指标的Spearman相关性分析结果显示,可被引文献量、作者数、机构数、全国比重彼此之间都具有很强的正相关关系,该结果进一步体现了F1(N1)对被引强贡献度的合理性。
3.2弱贡献度公因子
回归分析结果表明,篇均引文量、基金论文比、本刊比重、引用半衰期、可被引文献比等指标虽对被引具有一定的作用,但贡献度相对较低。
(1)基金论文比。将基金论文比作为期刊评价指标是否合理,一直备受争议。一些学者认为要重视基金论文比的作用;而另一些学者则明确表示,基金论文比是一个欠科学的期刊评价指标,甚至应该被彻底否定;当然,也有部分学者持比较中立的态度,认为基金论文比有一定的作用,应客观对待。本研究结果显示,生物学和物理力学期刊的基金论文比对被引频次的贡献度分别为6.2%和2.1%,地质学期刊的基金论文比和篇均引文量共同提取的公因子贡献度为18.1%。总体而言,基金论文比对期刊被引的贡献度不高。因此,可将基金论文比作为期刊评价的辅助指标,但不应过分强调基金论文比的作用。
(2)篇均引文量。本研究发现,期刊的篇均引文量对被引存在学科差异。地质学期刊篇均引文量和基金论文比对被引的总贡献度为18.1%,生物学期刊篇均引文量对被引贡献度为5.7%,而物理力学期刊篇均引文量与被引不存在显著相关性。这一结果部分支持了Biglu、梁春慧和葛赵青等的观点。从引文功能的角度,期刊的引文具有文献再发现的功能,一篇论文引用的文献越多,越容易得到相关领域研究人员或机构的关注,其被引用的可能性也就更大;再者,研究人员检索相关文献时一般采用关键词、主题词或者通过引文索引检索,因而无论是从文献本身的功能,还是从研究人员查找文献的习惯,都会导致平均引文数量较高的期刊获得更多的关注,相应的被引率也会提高。从引文价值的角度,较多的引文数量可以反映该论文的研究基础扎实,可能具有较高的学术价值,因而获得更多研究人员的关注和引用。
(3)引用半衰期。引用半衰期是计量学科知识老化水平的重要指标。一般认为,引用半衰期越短,意味着期刊引用的近期文献越多,表示该刊更关注最新的研究成果。而最新的研究成果会得到更多研究人员的关注,被引用的概率也就越高;反之亦然,期刊引用的文献比较老,意味着该期刊发表的论文很可能存在重复性研究,其被引用的可能性降低。本研究结果显示,地质学期刊的引用半衰期与被引虽存在负相关性。这虽然支持了顾璇提出的期刊引用半衰期越短,被引越高的观点,但是,应该注意到引用半衰期对被引的贡献度仅为6.5%。而生物学和物理力学期刊的引用半衰期与被引之间的关系没有通过显著性检验。这组数据的分析结果提示,将引用半衰期作为评价期刊质量或办刊水平指标的依据似乎并不充分。
(4)本刊比重和可被引文献比。地质学中N3(本刊比重、可被引文献比共同提取)对总被引的贡献度为6.3%,物理力学中F4(本刊比重)对总被引的贡献度为4.5%。本刊比重虽然可以体现期刊的专业化程度,且对期刊被引具有一定贡献,但是整体影响有限。如何评价该指标与期刊影响力乃至期刊质量之间的关系,仍需进一步探索。
3.3无贡献度因子
许多研究者认为,出版时滞长会导致文献老化,从而降低甚至失去被引用的机会。Tsay、Pautasso以及高慧芳等的研究都支持了上述观点。但是,本研究结果却显示,无论生物学、物理力学还是地质学期刊,出版时滞与被引之间的关系均不显著。这种现象是仅存在于这三个学科还是普遍现象,抑或国内外期刊存在差异,尚有待进一步验证。
4结论
通过对国内生物学、物理力学、地质学三个学科期刊的分析发现:
(1)期刊的规模和扩散力(可被引文献量、作者数、机构数、引用期刊数、全国比重)对被引频次具有较高的贡献度,对期刊被引有较大的影响,在一定程度上决定了期刊的被引频次。
(2)基金论文比、篇均引文量、本刊比重、引用半衰期、可被引文献比对被引频次贡献度较弱,而且影响程度存在学科差异,同一特征在不同学科对期刊被引频次的影响不同,在分析以上期刊特征对期刊被引频次的影响时应考虑学科本身的特点,不能一概而论。
(3)出版时滞与被引不存在具有统计学意义的相关关系,出版时滞的长短不会影响期刊的被引用情况。当然,由于本研究目前只选取了生物学、物理力学和地质学三个学科的期刊,在时间跨度上选择后五年内的被引用情况,上述结论能否应用于其他学科和时间跨度还需进一步验证。