临床科研中常用的统计分析方法
如何选取抽样方法,如何选取统计分析方法均是临床科研的难点问题。针对前者,我们已在《西部医学》2019年第31卷第4期刊发的“医学研究中的抽样方法”做了讲解[1]。经过周密设计和科学实施的临床研究还需要规范、科学的统计分析方法,才能得到可靠的结论[2],但专题讲述临床统计分析方法的文献较少,数据分析过程中采用何种统计分析方法,对临床研究者来说是研究中的难点问题。针对统计学方法的公式、内容、原理,陈彬教授就“确定多指标医学参考值范围的统计方法”在《西部医学》做了十三讲[3-10],为临床研究者提供了较好的参考。本文以实用、易懂、易掌握为原则,重点讲述相关统计学方法的适用条件。统计分析方法分为统计描述和统计推断,本文仅对以上两类分析方法做重点阐述。
1 统计描述[11]
统计描述就是对数据包含的信息加以整理、概括、浓缩,用恰当的统计图表及指标来表达资料的特征和规律,包括定性资料的统计描述和定量资料的统计描述。
1.1 定性资料的统计描述 对于定性资料,可以采用频数分布和相对数指标。相对数指标包括率、构成比、相对比。计算相对数时,观察单位不应该太小,必须要有足够的观察单位作为分母,计算的率才是稳定的,即大数原则“相对数应当在大数中计算和运用”。分析时不能用构成比代替率,构成比说明事物内部各组成部分,率表示某现象发生的频率或强度大小。
1.2 定量资料的统计描述 对于定量资料,离散型定量变量和连续型定量变量均可以采用频数分布表和频数分布图进行描述。定量资料集中位置的描述,可以采用均数、几何均数、中位数,定量资料离散程度的描述,采用极差、四分位间距、方差、标准差、变异系数。对于定量资料,先进行正态性检验,如果变量近似正态分布一般采用均数和标准差,偏态分布需采用中位数和四分位间距描述[12]。
2 统计推断
统计推断是指由样本数据对未知的总体参数做出估计或者比较,本文主要介绍临床研究中常见的统计推断,包括t检验、方差分析、2检验、秩和检验、相关与回归分析等。
2.1t检验t检验是以t分布为理论依据的假设检验方法,是定量资料分析常用的假设检验方法,常用于正态总体小样本资料的均数比较,t检验有三种形式:适用于单因素设计的三种类型:①单样本t检验(One-Sample T Test);单个样本的均数与已知总体均数比较的检验,例如某中药厂用旧设备生产的六味地黄丸,丸重的均数是8.9 g,更新设备后,从所生产的产品中随机抽取9丸,其重量分别是9.2、10.0、9.8、9.6、8.6、10.3、9.9、9.1、8.9 g,问设备更新后生产的丸药的平均重量有无变化。②两组配对样本t检验(Paired- Sample T Test):有三种适用情况:a.配对的两个受试对象分别接受两种不同处理之后的数据,如把年龄、同种属、同窝别的动物配对。b.同一样品用两种方法(或仪器)检验出的结果。c.同一受试对象处理前后测定的数据。例如对24名儿童接种卡介苗,按同年龄、同性别配成12对,每对中的2名儿童接种不同的结核菌素,一名接种标准品,另一名接种新制品,均注射在儿童的前臂,72 h后记录两种结核菌素的皮肤反应平均直径,问儿童皮肤对两种不同结核菌素的反应性有无差别。③独立样本t检验(Independent- Sample T Test),当两组实验资料是完全随机设计的,两组资料均满足正态分布,且满足方差齐性时适用。例如测定功能性子宫出血症中的实热组与虚寒组的免疫功能,知道两组淋巴细胞转化率,比较两组转化率均数是否不同[13]。
2.2 方差分析 方差分析(analysis of variance,ANOVA),两个样本均数比较采用的是t检验,多个样本均数的比较采用的是F检验。方差分析适用条件:①各样本是相互独立的随机样本。②各样本均来自正态总体。③各样本的总体方差相等。包括完全随机设计资料的方差分析、随机区组资料的方差分析、其他设计资料的方差分析,本文重点讲解前两种。
2.2.1 完全随机设计资料的方差分析 完全随机设计是把试验对象随机分配到不同试验中,各组分别接受不同的处理,试验结束之后,比较各组均数之间的差异有无统计学意义,采用单因素方差分析(one-way ANOVA)。例如研究单味中药对小白鼠免疫机能的影响,将50只小白鼠随机分成四组,分析四种不同用药情况对小白鼠细胞免疫机能的影响是否相同。
2.2.2 随机区组设计资料的方差分析 随机区组设计又称为配伍组实验设计,就是按处理和配伍两个因素各水平构成的所有试验方案进行试验,并且每个方案仅作一次试验的两因素无重复试验设计。由于无重复试验每一个试验方案只有一个数据,因此在方差分析时只能对因素的主效应进行分析,而不能分析因素间的交叉效应。对于完全随机设计资料的方差分析和随机区组设计资料的方差分析,经方差分析后得到处理组间的P