时间:2022-09-21 05:37:48
序论:在您撰写医学统计学论文时,参考他人的优秀作品可以开阔视野,小编为您整理的7篇范文,希望这些建议能够激发您的创作热情,引导您走向新的创作高度。
1.1单因素方差分析(ANOVA)两两比较误用独立样本t检验单因素方差分析设计3组以上的均数比较,如果总体比较有差异,需进行两两比较,一般用SNK法或LSD法。但部分研究者却将资料进行拆分,应用独立样本t检验进行两两比较,导致第Ⅰ类统计学错误发生率(假阳性率)增加,从而掉进了一个常见的“统计陷阱”,使所得结论可信度大大降低甚至得出错误结论。SNK法与LSD法虽然并非等价,实质是一致的。SNK法一般用于经方差分析结果具有统计学意义时才决定进行的两两事后比较,而LSD法可用于方差分析不足以具有统计学意义时也能进行两两比较[1]。比较两种方法在SPSS的输出结果形式,SNK是“分堆”比较,一目了然,对于组别数较多的研究更为好用,但没有具体P值,而LSD是在进行“两两”比较时,能给出具体的P值。
1.2两两比较时检验水准的重新调定χ2检验或秩和检验3组以上整体比较有差异时,需应用分割法进行两两比较,这时检验水准应由原0.05调定为0.0167,否则会增加第Ⅰ类统计学错误的发生率。特别当P值处于0.0167~0.05时,按照P<0.0167的标准,差异无统计学意义,而按照P<0.05的标准,却有意义,与事实相悖,出现假阳性,很容易得出错误结论。这种分割法有时很保守,当行列表资料分组多且为有序时可用Mantel-Haenszel卡方检验,也称线性趋势检验(testforlineartrend)或定序检验(Linear-by-Lineartest)[2]。统计路径:用SPSS进行计数资料的趋势检验,在输出结果中读取线性关联检验统计量(Linear-by-LinearAssociation,LLA),如P<0.05可得出随着病种级别的升高,检测指标逐渐升高的趋势。
1.3临床诊断试验中的统计学方法应用在临床诊断试验研究中,经常选取单项计量指标或者联合计量指标以诊断某种疾病,若仅用初级统计学方法如t检验、单因素方差分析等往往不能有效挖掘信息,此时应采用受试者工作特征曲线(ROC)对检测结果进行分析评价。ROC曲线分析基本原理是通过诊断界点的移动[3],获得多对灵敏度和误诊率(1-特异度),以灵敏度为纵轴、误诊率为横轴,连接各点绘制曲线,然后计算曲线下的面积,面积越大诊断价值越高。ROC曲线很直观,能根据敏感性与特异性之和最大化原则自动产生最有效的诊断临界点。具体路径可以参考相关统计专著[3]。统计学处理一般描述为:采用SPSS(版次)统计软件分析数据,对单项及联合检测结果作图绘成ROC曲线,计算曲线下面积(AUC)和标准误,其中联合检测结果变量即预测概率由Logistic回归产生(也可以用判别分析得出)。计量资料应用-x±s表示,运用独立样本t检验及单因素方差分析,两两比较采用SNK及LSD法,计数资料采用χ2检验。检验水准为0.05。具体内容可据情而定。
1.4重复测量资料的方差分析误用拆分文件的t检验或方差分析如研究共设3组,每位患者在3个时间点均查某项血指标,部分作者在处理此类数据时,常误将纵向(同一时间点3组的比较)与横向(同组3个时间点的比较)数据均应用拆分文件的t检验或单因素方差分析来处理,结果导致统计学第Ⅰ类错误发生。此组数据实质是重复测量资料,应采用重复测量资料的方差分析。SPSS中的统计路径:数据-分析-一般线性模型-重复度量。研究者可以参考相关书籍进行处理[3]。
1.52×2析因设计及析因方差分析实验是2×2析因设计时,分组有两个因素,A与B,故分组为A、B、O、A+B,这个设计在析因设计研究中很常用,但常会出现分组设计正确,却没有用析因设计方差分析。析因设计与单因素方差分析不同[4],它不但能分析治疗效果中处理因素的单独效应和主效应,还能分析因素间的交互效应,并能提高检验效能。非统计专业的研究者进行析因分析可能稍有难度,可参考相关统计学书籍提供的统计步骤进行此类分析[3]。
1.6Meta分析Meta分析是循证医学系统评价常用的方法[5],应用时需注意统计学处理中计数资料采用比值比(OR)作为效应变量。具体路径:先进行异质性检验,当P>0.05时,认为同质,选择固定模型;P≤0.05时,不同质,此时可采用敏感性分析或分层分析等异质性处理,使之达到同质后再选择固定模型;若采用异质性处理仍未达到同质,则采用随机模型,以上统计路径均需交代清楚。Meta分析的结果是以“森林树”体现的,审校中我们经常遇到作者绘制的“森林树”左上角“文献、对比、结果名称”等内容显示为“?”,这是由于部分版本的RevMan软件不能输入中文,此时可以考虑省去,或用Photo-shop软件添加相应中文。Meta分析作为一种高级统计方法,专业性要求较高,作者可参考循证医学类权威杂志上的文章格式,如《中国循证医学杂志》中“论著•二次研究”栏目的循证文章。
2科技论文中统计学处理的相关表述
2.1资料与方法中具体统计路径的描述“统计学处理”的内容常位于论文资料与方法的最后一段,一般来说包括统计软件名称及版次、统计描述、统计方法、检验标准等内容,亦可细致交待每个表格的具体统计方法。经典例子如下,“统计学处理:采用SPSS(版次)统计软件分析数据。计量资料用均数±标准差表示,采用单因素方差分析,两两比较采用SNK法及LSD法。检验水准为0.05”。上述内容包括了大致的统计方法,即具体的统计路径。此部分内容,没有绝对统一的规定[6]。常见的问题有:统计学方法描述不全、内容过于简单、存在粘贴抄写痕迹等。如部分论文的统计学处理中提及“以α=0.05为检验水准,P<0.05为差异有统计学意义”这句话,这在统计学上实质是一个重复句,保留其一即可。
在各种医学期刊中,半数以上是疗效观察方面的论著。现择其较普遍存在的统计学问题,结合实验设计基本原则加以讨论。
(一)对照与均衡性测定
国内医学期刊有关临床疗效观察的文章甚多,不少杂志刊登了一些事先未设计对照的文章,其结论难以令人信服。如《用柴葛解肌汤治疗上呼吸感染》一文,报道治愈好转率为97.7%,因无对照,无法断定其效果如何,因此,治愈好转率中含有假像。
对照的方法虽有多种,但对照的基本原则是与实验组齐同可比,最好作均衡性测定。
(二)安慰剂与盲法试验
安慰剂与盲法试验是医研(主要是比较性研究)中常用的科研方法,结果准确、误差性小。安慰剂在形、量、色、味等要与实验药物一样,不能给受试者和执行者任何暗示。这种试验就是双盲法试验。但近年来,尚有人用改良的双盲法,此法分两期:第一期(公开期)试验有效者留,无效者弃。有效者进入第二期(双盲试验),以确定疗效是否系安慰剂的作用。在预防效果观察时可采用该法,临床上应用诸多困难,应视具体情况而定。
(三)样本含量与重复原则
没有足够样本的研究结果,是经不起重复试验的,有的论文凭少数病例观实的结果下结论,是不慎重的。如《重症肺炎并发DIC29例》一文,作者观察脑型患者3例,其中死亡一例,就得出“一般脑型病死率高达57%,本组脑型病死率较低,看来及早用肝素阻断DIC过程,对降低脑型病死率可能具有重要意义”的结论。因无对照,结论不可靠。
(四)随机分组与实验设计类型
随机化分组即每个实验对象有同等机会被抽样(分配)到各组去,而不受任何系统因素的影响。常用的实验设计类型有完全随机设计、自身对照设计、交义设计、配偶设计、随机区组设计、拉丁方设计、正文(析因)设计、序贯设计、半数效量实验设计(动物试验),回顾性与前赡性调查研究设计等。科研设计时应根据研究目的要求选择不同类型的实验设计方法,进行相应的统计处理。
概率分布(probabilitydistribution)是医学统计学中多种统计分析方法的理论基础。授课内容一般包括:二项分布、Possion分布、正态分布、t分布、F分布等。
借助概率分布常常可以帮助我们了解生命指标的特征、医学现象的发生规律等等。例如,临床检验中计量实验室指标的参考值范围就是依据正态分布和t分布的原理计算得到;许多医学试验的“阳性”结果服从二项分布,因此它被广泛用于化学毒性的生物鉴定、样本中某疾病阳性率的区间估计等;而一定人群中诸如遗传缺陷、癌症等发病率很低的非传染性疾病患病数或死亡数的分布,单位面积(或容积)内细菌数的分布等都服从Poisson分布,我们就可以借助Poisson分布的原理定量地对上述现象进行研究。
在生物信息学中概率分布也有一定应用。例如,Poisson分布可以用于基因(蛋白质)序列的相似性分析。被研究者广泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速将研究者提交的蛋白质(或DNA)数据与公开数据库进行相似性序列比对。对于序列a和b,BLAST发现的高得分匹配区称为HSPs。而HSP得分超过阈值t的概率P(H(a,b)>t)可以依据Poisson分布的性质计算得到。
二、假设检验
假设检验(hypothesis)是医学统计学中统计推断部分的重要内容。假设检验根据反证法和小概率原理,首先依据资料性质和所需解决的问题,建立检验假设;在假设该检验假设成立的前提下,采用适当的检验方法,根据样本算得相应的检验统计量;最后,依据概率分布的特点和算得的检验统计量的大小来判断是否支持所建立的检验假设,进而推断总体上该假设是否成立。其基本方法包括:u检验、t检验、方差分析(ANOVA)和非参数检验方法。
假设检验为医学研究提供了一种很好的由样本推断总体的方法。例如,随机抽取某市一定年龄段中100名儿童,将其平均身高(样本均数)与该年龄段儿童应有的标准平均身高(总体均数)做u检验,其检验结果可以帮助我们推断出该市该年龄段儿童身高是否与标准身高一致,为了解该市该年龄段儿童的生长发育水平提供参考。又如,医学中常常可以采用t检验、秩和检验比较两种药物的疗效有无差别;用2检验比较不同治疗方法的有效率是否相同等等。
这些假设检验的方法在生物实验资料的分析前期应用较多,但由于研究目的和资料性质不同,一般会对某些方法进行适当调整和结合。
例如,基于基因芯片实验数据寻找差异表达基因的问题。基因芯片(genechip)是近年来实验分子生物学的技术突破之一,它允许研究者在一次实验中获得成千上万条基因在设定实验条件下的表达数据。为了从这海量的数据中寻找有意义的信息,在对基因表达数据进行分析的过程中,找到那些在若干实验组中表达水平有明显差异的基因是比较基础和前期的方法。这些基因常常被称为“差异表达基因”,或者“显著性基因”。如果将不同实验条件下某条基因表达水平的重复测量数据看作一个样本,寻找差异表达基因的问题其实就可以采用假设检验方法加以解决。
如果表达数据服从正态分布,可以采用t-检验(或者方差分析)比较两样本(或多样本)平均表达水平的差异。
但是,由于表达数据很难满足正态性假定,目前常用的方法基于非参数检验的思想,并对其进行了改进。该方法分为两步:首先,选择一个统计量对基因排秩,用秩代替表达值本身;其次,为排秩统计量选择一个判别值,在其之上的值判定为差异显著。常用的排秩统计量有:任一特定基因在重复序列中表达水平M值的均值;考虑到基因在不同序列上变异程度的统计量,其中,s是M的标准差;以及用经验Bayes方法修正后的t-统计量:,修正值a由M的方差s2的均数和标准差估计得到。三、一些高级统计方法在基因研究中的应用
(一)聚类分析
聚类分析(clusteringanalysis)是按照“物以类聚”的原则,根据聚类对象的某些性质与特征,运用统计分析的方法,将聚类对象比较相似或相近的归并为同一类。使得各类内的差异相对较小,类与类间的差异相对较大1。聚类分析作为一种探索性的统计分析方法,其基本内容包括:相似性度量方法、系统聚类法(HierarchicalClustering)、K-means聚类法、SOM方法等。
聚类分析可以帮助我们解决医学中诸如:人的体型分类,某种疾病从发生、发展到治愈不同阶段的划分,青少年生长发育分期的确定等问题。
近年来随着基因表达谱数据的不断积累,聚类分析已成为发掘基因信息的有效工具。在基因表达研究中,一项主要的任务是从基因表达数据中识别出基因的共同表达模式,由此将基因分成不同的种类,以便更为深入地了解其生物功能及关联性。这种探索完全未知的数据特征的方法就是聚类分析,生物信息学中又称为无监督的分析(UnsupervisedAnalysis)。常用方法是利用基因表达数据对基因(样本)进行聚类,将具有相同表达模式的基因(样本)聚为一类,根据聚类结果通过已知基因(样本)的功能去认识那些未知功能的基因。对于基因表达数据而言,系统聚类法易于使用、应用广泛,其结果——系统树图能提供一个可视化的数据结构,直观具体,便于理解。而在几种相似性的计算方法中,平均联接法(AverageLinkageClustering)一般能给出较为合理的聚类结果2。
(二)判别分析
判别分析(discriminantanalysis)是根据观测到的某些指标的数据对所研究的对象建立判别函数,并进行分类的一种多元统计分析方法。它与聚类分析都是研究分类问题,所不同的是判别分析是在已知分类的前提下,判定观察对象的归属3。其基本方法包括:Fisher线性判别(FLD)、最邻近分类法(k-NearestNeighborClassifiers)、分类树算法(ClassificationTreeAlgorithm),人工神经网络(ANNs)和支持向量机(SVMs)。
判别分析常用于临床辅助鉴别诊断,计量诊断学就是以判别分析为主要基础迅速发展起来的一门科学。如临床医生根据患者的主诉、体征及检查结果作出诊断;根据各种症状的严重程度预测病人的预后或进行某些治疗方法的疗效评估;以及流行病学中某些疾病的早期预报,环境污染程度的坚定及环保措施、劳保措施的效果评估等。
在生物信息学针对基因的研究工作中,由于借助了精确的生物实验,研究者通常能得到基因(样本)的准确分类,如,基因的功能类、样本归结于疾病(正常)状态等等。当利用了这些分类信息时,就可以采用判别分析的方法对基因进行分类,生物信息学中又称为有监督的分析(SupervisedAnalysis)。例如,基因表达数据分析中,对于已经过滤的基因,前三种方法的应用较为简单。而支持向量机(SVMs)和人工神经网络(ANNs)是两种较新,但很有应用前景的方法。
(三)相关分析
相关分析(correlationanalysis)是医学统计学中研究两变量间关系的重要方法。它借助相关系数来衡量两变量之间的关系是否存在、关系的强弱,以及相互影响的方向。其基本内容包括:线性相关系数、秩相关系数、相关系数的检验、典型相关分析等。
我们常常可以借助相关分析判断研究者所感兴趣的两个医学现象之间是否存在联系。例如,采用秩相关分析我们发现某种食物中黄曲霉毒素相对含量与肝癌死亡率间存在正相关关系;采用线性相关方法发现中年女性体重与血压之间具有非常密切的正相关关系等等。
生物信息学中可以利用相关分析建立基因调控网络。如果将两个不同的基因在不同实验条件下的表达看作是两个变量,相关分析所研究的正是两者之间的调控关系。如采用线性相关系数进行两基因关系的分析时,其大小反应了基因调控关系的强弱,符号则反应了两基因是协同关系(相关系数为正),还是抑制关系(相关系数为负)。
四、意义
生物信息学不仅是医学统计学的研究前沿,更是医学研究由宏观向微观拓展的重要领域,其研究内容已逐渐为多数医学院校的学员了解和熟悉。而如何对新技术产生的生物实验数据进行准确合理的分析,却成为生物信息学研究的主要瓶颈之一。
在医学统计学课堂教学中引入生物信息学实例,而不仅仅局限于常见的医学、卫生领域的例子,将难以理解的统计理论和方法与前沿的生物实例相结合,拓宽了学员的视野,提高了学员的学习兴趣,更可以加深对所学知识的理解;与此同时,使学员掌握了生物实验数据的先进分析方法,扩大了学员的知识面,提高了他们今后开展医学科研工作的能力。
医学统计学的教学应以提高研究生解决实际科研问题的能力为目标,使研究生形成正确的和严谨的统计学思维方法和技能,帮助医学研究生在今后的科研工作中正确运用医学统计学方法,顺利完成研究生学业以及将来在工作中的科研任务。然而,笔者在教学实践中发现有一些需要改进的问题。
一、研究生医学统计学教学中遇到的主要问题
(一)研究生统计学基础知识较为薄弱
虽然大部分学生在大学本科期间学习过统计学,但多数人仅学习过较简单的统计学基础知识,进入研究生阶段医学统计学学习后,学习比较吃力,并且由于总学时数的限制,教师在理论课的教学中对单个统计学方法的使用讲解较多,而对一些研究生在完成学位论文期间或将来毕业后较为实用的统计学方法却没有时间讲解,这就造成了研究生对学过的统计学方法一知半解,而将来可能用得上的统计学方法却没有学会。笔者在解答一些已经毕业参加工作的研究生的问题时,发现有些问题十分基础,本应该在研究生学习阶段掌握而没有掌握。
(二)课题设计统计学缺陷较常见
目前,国内大部分高校研究生医学统计学课程一般安排在研一上学期,而研究生应用统计学知识进行课题设计要到研究生二年级才启动。许多研究生在课堂学习阶段对统计学知识本来就没有彻底学透,又要再经过一年多才进入课题设计有实验研究,对学习过的统计学知识已经有一些遗忘,所以在进行课题设计时不能正确运用学过的相关知识,造成课题设计中有较多的统计学缺陷。而课题设计如果不正确,无法保证后续的研究结果的科学性和可信性。
(三)学位论文统计学错误普遍存在
国内外期刊对论文中的统计学方法要求都很高,因此研究生的科研论文需要正确运用统计学知识对研究数据进行分析、整理。但与此形成鲜明对比的是,很多研究生不能把学习过的统计学知识正确运用到研究论文中。尤其是学习临床专业的医学研究生,很多研究资料和数据来源于人群研究,涉及样本量、对照组的选择等基本的统计学常识,这些基础性错误却在研究生的论文中大量存在。这些问题与现在对高素质人才的培养已经不相适应,需要加以改进。
二、对策与建议
(一)强化课堂教学,巩固医学统计学知识基础
巩固基本统计方法和知识是医学统计学的基础,通过课堂教学,使学生掌握基本的统计方法原理、计算过程和结果解释。在教学中既要注重基本原理和基本概念的讲解,使研究生切实掌握基本的统计学知识,在论文写作中不出现低级的统计学错误。在此基础上,老师在课堂上应该由简到繁,深入浅出,逐步增加难度和深度,讲解一些研究生在学习阶段和将来工作中有用的、较为高级的统计学方法。目前,科学技术更新速度很快,同样统计学的重要工具——统计软件也更新很快,因此,老师要及时更新自己的知识,并向学生介绍最新、最先进的统计方法和软件。
(二)注重学用衔接,提升研究生课题设计的科学性
研究生的课题设计是科学研究成败的关键之一,教师在教学过程中要向学生强调其重要性,让学生带着课题设计中的问题进入课程学习,让学生结合自己的专业,做好论文前期的准备工作,完成科研选题,为毕业论文开题做好准备。要指出课题设计中应当注意的统计学问题,如样本量、对照组选择等,使学生意识到统计学的基本知识是保证自己课题设计科学性的关键,在今后的课题设计中自觉以正确的统计学方法作为指导,从而保证课题设计的科学性,为其成长为高层次的医学科研人才打下良好的基础。
(三)采用实例分析,减少研究论文中的统计学错误
在课堂上以一些已经发表的高水平论文为例,详细讲解医学统计学方法的具体应用,使研究生在撰写论文时,减少论文中的统计学错误,减少文章因为统计学问题而被拒稿;教师在课堂上也可以用一些已经发表的、但是有明显统计学错误的论文作为反面教材,给学生进行分析、讲解,使学生从正反两个方面知道避免论文中的统计学错误的重要性。另外,要注意提醒学生,在数据处理和论文撰写过程中,运用统计学方法时要注意其使用条件,切不可误用,对审稿人指出的统计学错误要认真进行修改或答复。
利用现代化学习工具学习当今社会发展所需要的知识是时代的要求,因此应转变教育思想和更新教育观念,改变以往的教学方式、学习方式和学习内容,探索适应现代社会、经济、科技及文化发展的教育观念和人才培养模式,形成培养适合21世纪所需要人才的教学体系.医药院校的数学应以应用为主要目的,应改变以掌握基本知识、基本理论及基本方法为目的的方式,把教学重点转移到讲解数理统计学概念、思考方法、形成及应用背景等,引导学生思考数理统计学的思维特征,理解数理统计学思想,引导学生应用数理统计学方法解决实际问题,以达到学以致用的目的.学好和用好医药数理统计学并不需要高深的数学知识,而是要促使学生在学习数理统计学的时候改变思维模式,使学生从医药学的形象思维模式向数理统计学的抽象思维和逻辑推断模式转变,并结合教材中例题的讲解、学生自身实例资料的分析及作业的批阅使学生理解和掌握统计学中的基本概念、基本方法、统计符号及公式等.
2精简和更新教学内容
在教学内容方面做到突出实用性,适当地减少或减弱概率论部分的理论性和难度,以直观、趣味和易于理解的方式把概率论作为数理统计的基础知识加以介绍.在假设检验部分注意阐述数理统计方法的思想、应用的背景及应用中所需的条件,重点讲解假设检验应该如何选取原假设和备择假设,如何对得出的结论进行合理的解释;在参数估计部分着重地讲解参数估计在实际应用中的重要性、合理性及应用中应注意的问题,区间估计中置信区间的理解及单侧置信限在应用中的意义等;在方差分析部分讲清楚引进方差分析的意义、假设检验的方法对多个总体进行多次t检验时的缺点、方差分析应用的条件及合理解释检验结果等;在回归分析部分注意阐述量与量之间的关系、回归方程的理论意义及对回归方程结果在应用中的解释等.目前SPSS软件是国际医学论文中应用最广泛的统计软件[2],国内的大部分医学期刊也要求论文数据统计分析要应用统计软件处理,统计检验结果要用P值来表示,更要求学生了解统计软件的使用方法,做到正确使用统计软件.
3互动式的教学方法培养应用、创新型人才
传统的教学方式是知识传授型教学,即教师在课堂上灌输知识,在有限的时间内按教学大纲要求把大量的教学内容尽可能地讲授完毕,不能有效地调动学生对学习的主动性,忽视学生应用能力的发展,结果导致学生把主要精力投入到统计计算上,很难有时间去深入分析统计结果.互动式教学方法要求教师在教学中充分发挥教师的主导作用,同时让学生处于教学的中心,在加强课堂讨论的同时,由教员归纳总结,充分调动学生的学习兴趣,提高学生的主动性和创造性.统计学应用能力的培养主要指可正确选择和应用统计分析方法解决医药学科学研究和医药工作中的实际问题[3].为了避免学生滥用及错用统计方法,教师要重点讲清各种方法的适用条件及特点.在考试方法上亦采用开卷考试,使学生不再花大量时间去推敲和死记那些复杂的公式,不再难于分清和理解符号及公式.通过几年来的改革实践,发现上述教学内容、方法及手段的改革增强了学生的学习兴趣,使学生真正体会到数理统计学的内容在医药及日常生活中的应用价值,激发学生的创造性思维,取得了良好的效果.
[参考文献]
[1]刘定远.医药数理统计方法[M].第3版.北京:人民卫生出版社,1999.20.
[2]王锐,陈长生,徐勇勇,等.统计软件SPSS教学的经验与体会[J].西北医学教育,2004,12(5):425.
[关键词]医学期刊;队列研究;统计学问题;对策
[中图分类号] R181.2+3 [文献标识码] A [文章编号] 1674-4721(2016)08(b)-0152-03
队列研究又称前瞻性研究、随访研究及纵向研究,是将一个范围明确的人群按是否暴露于某可疑因素及暴露程度分为不同的亚组,追踪其各自的结局,比较亚组之间结局的差异,从而判定暴露因子与结局之间有无因果关联以及关联大小的一种观察性研究方法[1]。这里暴露是指研究对象接触过某种待研究的物质(如重金属等)、具备某种待研究的特征(如年龄、性别及遗传因素等)或行为(如吸烟等)[2]。观察的结局主要是与暴露因子可能有关的结局。队列研究中先因后果的时间顺序相对明确,受一些偏倚的影响小,是观察性研究方法中验证病因能力最强的研究方法[3],其证据等级仅次于严格设计的随机对照试验。尽管我国的前瞻性队列研究起步较晚,但自20世纪八九十年代起也陆续开展了一些队列研究[4]。如果这些研究未能正确使用该研究方法,不但不能有效验证病因假设,还有可能得出错误的结论。本文收集并分析了近年国内公开发表的队列研究论文,发现其中存在的统计学问题并提出改进意见和建议,旨在引起作者、编者和审稿专家的重视,提高期刊论文的质量。
1队列研究文献的检索
以“队列研究”“前瞻性研究”“随访研究”“纵向研究”为关键词,在中国知网(CNKI)和万方数据库中检索2014~2015年公开发表的队列研究文献共1874篇,剔除重复文献和非研究性文献后,获得研究性文献929篇(表1)。
2 载文量及统计学方法应用情况
根据李康等[5]主编的《医学统计学》和Cochrane推荐的Newcastle-Ottawa-Scale(NOS)工具[6]对检索到的文献进行统计学方法应用情况评判,评判结果在文献评价表中登记并复核,采用Excel管理和分析数据。结果发现,绝大多数队列研究采用χ2检验和Logistic回归方法进行统计推断,约占82.0%;而使用了生存分析及Cox比例风险回归模型的仅占13.0%(表2)。
3常见统计学问题
3.1研究对象描述不清楚或不确切
研究对象的选择是随访研究的首要问题,因此文中关于研究对象的描述必须准确清楚,根据研究属于总体研究或是抽样研究,对研究对象的描述应加以区别[7]。目前我国队列研究中关于研究对象的描述主要存在的问题为:描述中对总体研究或抽样研究未加以明确说明;抽样研究中的描写模棱两可,未说明具体抽样方法。从统计学上讲,总体研究的研究对象是根据研究目的所确定的同质观察单位的全体,而抽样研究的研究对象是总体中随机抽取的部分观察单位。
例如,就“某高校教师肥胖率及其对糖尿病发病影响的研究”而言,首先要制定相应的纳入标准与排除标准,研究的纳入标准为“某高校在编、在职且未患糖尿病的教师”,排除标准为“妊娠期、哺乳期女教工”。如果研究为总体研究,其研究对象应是该高校的所有在编、在职且未患糖尿病的非孕(哺乳)教师;如果研究为抽样研究,则其研究对象是该高校所有在编、在职且未患糖尿病的非孕(哺乳)教师的一个随机样本,研究对象描述中还应具体说明所使用的抽样方法,如单纯随机抽样、系统抽样、整群抽样或分层抽样等,同时写明随机抽样的具体实施方法。
3.2结局事件及其判断标准描述不全面
随访研究的另一个重要因素是结局事件,其指随访观察中将出现的预期结果事件,研究中既要记录是否发生了结局事件,还应记录是否存在失访及失访原因(失去联系、因其他疾病死亡、研究终止)。分析我国2014~2015年已发表的队列研究文章发现,大多数研究均未描述是否存在失访,部分研究对结局事件的判断标准描述不全面。按照队列研究的设计要求,结局事件要有明确统一的判断标准。例如,2型糖尿病结局的判断标准[8-9]:确诊糖尿病,即自我报告医生诊断糖尿病和(或)正在使用胰岛素和(或)口服降糖药治疗者;未确诊糖尿病,即未诊断糖尿病但空腹血浆葡萄糖水平≥7.0 mmol/L者;对于随访期发生死亡者,如果其死亡原因中含有糖尿病也认为是随访期发生2型糖尿病。
3.3统计分析不充分或错误
3.3.1基线特征描述不全面 队列研究中暴露组与非暴露组基线特征是否存在差异以及差异的方向直接影响研究结果的解释,因此基线特征的描述是队列研究资料分析必不可少的内容。而目前国内的队列研究文献中存在较严重的不按暴露有无分组描述基线特征的现象。此外,如随访过程中存在失访,则失访者与随访者基线特征的比较也直接影响研究结果的解释。在查阅的929篇研究性队列研究文献中无失访情况描述,无失访者与随访者基线特征比较者达90%以上。
因此,队列研究的资料分析应首先比较暴露组与非暴露组基线特征的一致性,以分析基线特征的差异对研究结果是否有影响以及影响方向,同时也可确定多因素分析中需要调整的混杂因素。如果研究中有失访,还应比较失访者与随访者的基线特征是否一致,以判断失访对研究结果是否有影响以及影响方向。
3.3.2统计推断方法选择不当 统计学方法的选择一向是医学科学研究中的难点问题。队列研究中主要涉及的统计推断方法包括χ2检验、Logistic回归以及Cox比例风险回归模型,此三种方法的误用和混用在队列研究文献中较严重,包括误用χ2检验代替Logistic回归、误用Logistic回归代替Cox回归等。由表2可知,929篇研究性队列研究文献中应用了Cox回归的仅占13.0%,且2015年的比例与2014年基本相同(13.1% vs 13.0%),可见这一方法的正确应用近两年内并未引起作者以及编辑足够的重视。
队列研究中统计学方法选择的正确思路为[10]:若暴露组与非暴露组的基线特征一致,则可以直接应用χ2检验比较暴露组与非暴露组结局事件发生率的差异,以判断暴露因素与结局事件是否有关联,同时计算相对危险度(relative risk,RR)及其95%置信区间,进一步说明两者的关联强度。相反,若暴露组与非暴露组的基线特征存在差异,应采用多因素的回归分析对混杂因素进行控制。如果数据资料中无时间变量,可采用Logistic回归,并在模型中调整组间存在差异的基线特征变量;如果有时间变量,则应采用Cox回归,并在模型中调整组间存在差异的基线特征。
3.4其他问题
国内公开发表的队列研究文献存在的其他问题:①应用Logistic回归或Cox回归时,分类变量或等级变量无赋值说明,造成结果解释的混乱。例如,只有在明确“男性=1,女性=0”或者相反的情况下,才能正确解释暴露因素与研究结局之间的关系。②误用χ2检验公式:应该使用校正公式时,却应用了非校正的通用公式或专用公式;不能应用χ2检验时,却计算了χ2值。例如,两组率比较时,只有满足总例数n≥40且理论频数T≥5的条件下,才能采用非校正的四格表χ2检验的通用公式或专用公式;如果n≥40且1≤T
4队列研究医学论文作者及编辑应注意的问题
分析结果表明,队列研究医学论文的统计学方法应用基本正确,编辑人员也比较重视统计学方法的使用情况,但是仍有部分论文在研究设计和统计分析方法的应用上存在一些问题,导致的研究结果缺乏科学性和可信性。为使作者、编辑和审稿者高度重视统计学的正确应用,进一步提高队列研究医学论文的质量,笔者认为还应做好以下工作。
4.1提高对统计学知识的认识,强化统计学意识
目前,国内医学科研工作者未认识到医学统计学的重要性,对医学统计学的重视程度还不够。因此,要加大“医学统计学在医学科研中重要性”的宣传力度,提高科研工作者对医学统计学的认识;在医学科研工作中普及医学统计学知识,强化医学统计学意识,促使其在科研设计、数据分析和论文撰写中正确应用医学统计学方法[11]。
4.2加强流行病学与医学统计学专家审稿工作
医学研究,包括队列研究,其统计分析都是以科学研究设计为基础的。研究设计不科学、有缺陷,即使应用了高级的统计学方法也于事无补。所以,审稿专家在具备丰富的专业知识的同时,还应具备一定的医学统计学和流行病学知识,能够做到从研究设计到统计分析,系统地审核研究结果的科学性、可靠性,确保论文质量[12]。此外,如果条件允许,所有稿件应先通过流行病学与医学统计学专家的审核,然后再由各专业学科专家审稿,以确保研究成果的真实可靠[13]。因此,医学期刊编委会应增设流行病学与医学统计学专业的专家委员,严格审核论文的研究设计和统计分析,不合格的论文坚决不发表,这样才能不断提高稿件质量和水平。
有计划地定期聘请流行病学与医学统计学专家对期刊编辑人员进行流行病学与医学统计学知识培训[14]。通过定期举办专业知识讲座、选派编辑人员参加专题培训班、定期组织考核、根据考核结果给予适当奖励等措施,以提高编辑人员学习流行病学与医学统计学知识的积极性,不断提高其相关知识水平,最终达到提高论文质量的目的。
[参考文献]
[1]张啸飞.前瞻性队列研究及生存分析[A]//2014浙江省临床流行病学与循证医学学术年会论文汇编[C].浙江,2014: 15.
[2]李立明.流行病学[M].5版.北京:人民卫生出版社,2003:58-59.
[3]李立明,吕筠.大型前瞻性人群队列研究进展[J].中华流行病学杂志,2015,36(11):1187-1189.
[4]王慧,陈培战,张作文,等.我国人群队列研究的现状、机遇与挑战[J].中华预防医学杂志,2014,48(11):1016-1021.
[5]李康,贺佳.医学统计学[M].6版.北京:人民卫生出版社,2013:84-150.
[6]何琼,黄渊秀,康文婧,等.2001-2010年我国伤害预防病例对照研究及队列研究文献质量评价[J].中华疾病控制杂志,2014,18(10):913-916.
[7]王芳,戴国华,娄昊.循证中医药队列研究的随访设计[J].山东中医杂志,2016,(1):14-17.
[8]樊森,陈纪春,黄建凤,等.中国成人看电视时间与2型糖尿病发病关系的前瞻性队列研究[J].中国循环杂志,2014, 29(5):372-376.
[9]李卫东,傅坤发,连燕舒,等.成人非酒精性脂肪肝与2型糖尿病发病关系的前瞻性队列研究[J].中国全科医学,2015, 18(28):3426-3429.
[10]韩梅,陈薇,曹卉娟,等.比较效果研究常用方法之二:队列研究设计[J].现代中医临床,2015,22(3):20-23.
[11]沈洪兵.重视大型队列研究的人才梯队建设和技术储备[J].中华预防医学杂志,2014,48(7):547-548.
[12]高永,张中文,石德文,等.基于Excel的统计分析系统在期刊编辑部审稿中的应用[J].编辑学报,2013,25(5):478.
[13]黄晨,袁平戈,张大志.医学期刊来稿中有关统计学错误分析[J].现代医药卫生,2013,29(15):2268.
健康网讯: 南京铁道医学院卫生系 周达生 二、统计指标与统计处理方法要合理运用
在各种医学期刊论文中,对统计学处理与统计指标的合理运用问题,已比过去有所重视,但尚存在不少问题。
(一)均数与标准差、标准误的合理运用问题
在医学论文中运用均数(表示各变量值平均水平与集中趋势)、标准差(表示变量值个体问离散情况与程度)和标准误(表示样本群体间差异程度,衡量抽样误差大小)的地方是很常见的,而达到合理运用尚存在一些问题。例如,在比较两样本统计量时只考虑平均水平(均值),而忽视了离散情况(标准差)和抽样误差(标准误);在正常值研究时,如资料近似正态分布,应当用均值加减K倍标准差(X±KS)来确定95%的正常值范围(K根据样本大小查K值表而定),应当标明标准误,而错用了标准差等。如《正常小儿三种不同剂量及正常成人50微克PHA皮试反应强度研究》一文中写道:“正常值范围为均值±2×标准误”。井写道:“小儿50微克组:均值±2×标准误=2.01~18.1毫米”。显然是错误地把标准误当成标准差用作估计正常值了。
(二)正常值研究中的几个问题
临床正常值确定方法依资料频数分布类型而定,主要有两种:一是均值加减标准差法适用于近似正态分布资料,二是百分位数法,适用任意分布资料。此外,角度资料(如脑血流图、心电图等的角度数据)运用圆形分布法,Poisson分布资料用Poisson分布法,正偏态分布资料用对数正态分布法等来处理。现今全国发表的一些医学论文中,正常值方面的问题也较多。引一些实例加以研究。
如在《迁延性、慢性肝炎患者植物血凝素皮试应用价值的探讨》一文中写道:“正常人甲组156人…平均值±标准误为15.4±0.4mm(平均值上标准差为15.4±5.6mm)。”那么,正常值是角标准误与标准差咖个统钎量来计算的呢?是加减1倍还是2倍标准差(或标准误)呢?作者均来说明。
又如《正常儿童尿游离α氨基酸氮的测定》一文,对1~13岁(分四个年龄组)125名正常儿进行研究,在正常值研究设计及分析时存在三个问题:(1)样本含量不足:如不同性别、不同年龄组的测定值仅据15人的结果而定正常值,显然是不妥的。作者针对各组结果矛盾现象,在讨论中两八提到“可能因例数太少,不能切实反映客观规律的缘故。”若按不同性别、年龄组确定正常值,一般要求每组100~12O人方能悦明问题。(2)错把标准误当作标准差用作估计正常值范围:文中说:“1~13岁正常儿童的游离α氮基酸氮/总氮%的均值可信限为:1.30±3×0.036,即1.19~1.41”。这里将标准误0.036当作标准差用作估计正常值了。正确的应是:“游离α氨基酸氮×l00/总氮%的95%正常值范围为1.30±2×0.4=0.~2.3。这里0.4是标准差。正常值范围在正态分布资料时,如考虑到样本大小及把握度,最好表达为单侧:+KS或-KS;双侧±KS。式中K值表(见周达生:医学问答,中华儿科杂志(4):245,1980)。(3)按性别、年龄组制订正常值问题:当研究对象有多个年龄组时,两组均数间比较用t检验,多组均数间比较可用F-Q检验,若差异显著,则需按不同性别、年龄组分别制订正常值。
(三)联系与因果
在临床实验研究中,经某种处理(如治疗)后受试对象出现某种反应(如治愈),并不能肯定是因果关系。有时比较两变量之间关系时,虽明显相关,但也不能断言其间有因果关系,只能说有一定统计联系(苏德隆:联系与因果。中华预防医学杂志13:106,1979)。在医学论文中甚至有不作相关回归分析就胃然下类似结论的。要了解有无因果关系,有时可进一步作回归分析(当然因果可表现为回归关系,但呈回归关系不一定是因果关系)。
(四)多组多级小值频数处理问题
在临床及动物实验研究中常遇到多组多级(R×C表)小值频数的比较,论文中大多忽视此类数据的合理统计处理,主要问题有:(1)未加适当统计处理,不考虑抽样误差而凭表面数字差别就轻易下结论。(2)处理方法不恰当。对此类数据可采用超几何概率计算法(见周达生:医学科研中乡组小值频数统计处理方法探讨。中华预防医学杂志(4):211,1980)、薛仲三氏X3检验公式(见薛仲三,医学统计方法和原理。366页,人民卫生出版社,北京1978)和秩和检验与等级指数法(黄镇南:等级型资料的三种统计分析方法,湖南医学院,长沙,1980)等。
(五)零反应的统计处理
两组计数比较,若一组有零反应,即出现0%或100%情况时,可用零反应公式处理。
如《病毒性肝炎中医辩证与机体免疫状态的初步探讨》一文,作者对19例迁延件肝炎中医辨证与淋转测定结果作了分析(原文表3)。由于作者对数据未作处理而下结论,不少信息失落,有些矛盾现象难以解释。原表3中有三处出现有零反应,宜分割后列出三个四格表,用零反应检验法处理。本例为双侧检验,差异显著性水平定力0.25和0.005。从三个四格表分析结果看,仅气虚与阴虚淋转测定值之间差异显著(P<0.005),而正不虚与气虚和阴虚问差异均不显著(P>0.025)。从而提示在虚证中还要区别对待,只有气虚者免疫功能才显著地低下。这样可使文中矛盾现象找到合理解释。