生物医学动物实验研究论文
1实验设计
科研人员在进行生物医学研究时,能否正确应用统计学知识,直接影响研究的质量。统计设计的任务是系统地安排研究的部署和实施,直至研究结果的解释,力求用最少的人力物力获得可靠的结论和信息。其目的是确定某种治疗是否会显示出某种效果。设计实验时应遵循唯一差异原则,即两组比较时,只有不同加工因素引起的差异,而与其他实验条件相关的非加工因素应保持相等。但是,治疗组和对照组之间的反应差异并不一定意味着这是治疗的结果。造成差异的还有另外两种可能性,即偏差和偶然性。偏倚是指系统性的差异,并不是群体间的治疗差异造成的。生物医学实验中统计设计和分析的目标是消除潜在的偏倚,减少偶然性[2]。
1.1实验的偏倚和控制
偏倚是从设计到实验实施和结果分析的每个环节都存在一些人为的、系统的非随机误差。不是采样造成的,而是一种偏差,使得实验结果偏离其真实值。从选定的生物医学问题到研究方案的制定和实施,实验的完成,实验的分析和解释,甚至实验结果的发表,都可能存在各种偏差[2]。这种偏差通常表现为系统误差。偏差的大小取决于研究方法和具体的实验条件。常见的偏倚包括选择性偏倚、观察性偏倚和混杂偏倚。我们必须认识到实验过程的偏倚,并从实验设计到整个研究过程的结束对其进行控制。正确的实验设计可以控制选择性偏倚,预先人为控制并采取相应措施可以避免和减少观察性偏倚。对于混杂偏倚,在设计阶段可以分层随机设计重要的混杂因素,使混杂因素在组间分布均衡;在统计分析阶段,将混杂因素视为分层因素或采用协变量分析方法消除混杂因素的影响。只有有效地控制或消除偏倚,才能减少假阳性或假阴性结果。
1.2减少意外事件的潜在影响
偶然性因素的作用可以减少,但不能完全排除。因为即使在进行得很好的研究中,接受同样治疗的动物也不可能有完全相同的反应。适当的统计分析可以使实验者评估假阳性的概率,即在完全没有治疗效果的情况下观察到差异的概率。概率越小,实验者发现真实效果的可能性越大。为了更有信心地检测真实效果,需要减少偶然性的作用,通过实验设计确保真实的“信号”能够在“噪声”之上被识别出来。
1.3实验设计要素
为了消除生物医学实验中的潜在偏倚,减少偶然性,应根据控制、重复、随机化和平衡四个原则,精心设计和控制实验设计的三个要素,即实验对象、加工因素和实验效果[3]。1.3.1实验对象实验中被加工因素作用的对象称为实验对象。需要选择不同种类的实验对象进行不同性质的实验研究。一个完整的实验设计所需的实验对象总数称为样本含量。在生物医学实验中考虑动物实验对象时应注意以下几个方面:①动物种属的选择:在选择实验动物的种属时,应特别注意其背景反应的水平。为了使反应“信号”水平最大化,通常意味着应该避免那些背景反应水平极低的动物物种或品系,但是如果使用反应过度的动物物种或品系,也会出现问题。动物物种选择中的其他问题,无论是实际的(寿命、体型、可获得性、对动物学特征的理解)还是理论的(生物化学、生理或解剖结构与人类的相似性),都需要从专业的角度仔细考虑和权衡。②动物数量:虽然从统计设计的角度可以得到一个实验所需的动物数量(样本含量),但得到的数值往往很大。因此,虽然样本含量的估计是保证结论可靠性(准确性和检验效率)的前提,但应基于实验的可操作性和对经济原则的考虑,结合统计计算结果和以往的生物医学研究经验来确定。③动物的体重和年龄:为保证实验对象的同质性,实验所用动物的体重和年龄应尽可能接近;动物体重的标准差不应超过平均值的10%;啮齿动物和其他小动物的年龄差不应超过1周,大型动物的年龄差不应超过1月。④动物分层:为了准确检测一个处理因素引起的差异,各处理组在其他可能影响实验结果的非处理因素上应尽可能同质。当动物谱系之间存在差异时,有两种方法可以得到更准确的结论。一种是在结果分析阶段将子系统作为“分层变量”处理,包括分别对两个子系统的结果进行分析,然后综合结果得到处理效果的总结论;二是将子系统作为实验设计的“阻断因子”,在这种情况下,对照组和治疗组中每个子系统的动物数量可以相等。除了上面讨论的“子行”,其他非处理因素,如性别、巢型、体重段等。,也可作为局部控制的分层变量,并据此进行分层随机分组。1.3.2加工因素在设计一个实验研究时,需要明确研究中的加工因素和影响实验效果的非加工因素。研究者希望通过研究设计的有计划的安排,把能够科学地考察其效果的因素称为加工因素或实验因素;研究者往往忽略重要的非加工因素或非实验因素(如动物的窝、体重等。)干扰实验因素的评估。许多其他不可控因素的综合影响统称为实验误差。实验结果是加工因素和非加工因素相互作用产生的实验效果。因此,如何控制和消除非加工因素的干扰,正确显示加工效果,是实验设计的基本任务。1.3.3实验效应实验效应是加工因素作用于被试的反应和结果,是反映实验因素强弱的标志,通过观察指标来反映(指标在统计学中常称为变量)。如果指标的选取不当,未能准确反映加工因素的作用,所得到的研究结果将是不科学的,因此观察指标的选取是关系到整个研究成败的重要环节。指标的观察应避免偏倚或偏差,结合专业知识,尽可能多的选择客观指标,在仪器和试剂允许的条件下,尽可能多的选择特异性强、灵敏度高、准确可靠的客观指标。对于一些半客观(如尿液pH试纸读数值)或主观指标(行为测量、病理观察),必须事先规定严格的读数值标准。只有这样,才能准确分析实验结果,提高实验结果的可信度。
1.4实验设计原则
为了防止结果的偏倚,保证实验结果的准确性和最大限度的表达,在设计生物医学实验时,必须遵循统计设计的四个基本原则:比较、重复、随机化和平衡。生物医学实验中对照组的设置必须满足三个条件:①对等原则,即唯一差异原则。控制组除了加工因素外,还有与实验组相同的非加工因素。各组之间相互比较,除处理因素不同外,其他方面应与实验组一致,如实验单位来源相同(动物种类、体重等。)以及相同的实验条件、操作方法和饲养环境。②同步原则:对照组和实验组建立后,在整个研究过程中始终处于同一时空。③特殊设计原则,任何对照组都是为相应的实验组专门设置的。文献中的记录、以前的结果或其他研究数据不得用作本研究的对比。
1.5生物医学中常见的实验设计类型
如果需要在同一个实验中同时评价几种不同的效果,实验者应该安排一种能够区分各自效果差异的实验设计方法。生物医学常用的实验设计有以下几种。1.5.1完全随机设计完全随机设计是生物医学动物实验中最常用的实验设计方法。这是一个单因素的k水平(k≥2)试验设计。即实验设计可以设置一个对照组或多个剂量组的实验方案。这种设计保证了无论实验者的主观倾向如何,每个实验动物都有同样的机会接受任何一种治疗。这种设计应用了重复和随机化的原则,因此可以使实验结果与非加工因素的影响基本一致,真实地反映实验的加工效果。1.5.2随机区组设计随机完全区组设计,简称随机区组设计,也称配伍组设计,是配对设计的扩展,将几个条件相同的受试者分成同一个区组或配伍组,然后根据随机性原则将同一个配伍组的受试者随机分配到各个实验组。这种设计方法的优点是每个区组的k个实验单元具有良好的同质性,比完全随机设计更容易检测出处理间的差异。这种方法要特别注意区组中实验单元数与加工数相同的要求。如果实验结果中存在缺失值,统计分析会丢失一些信息。1.5.3拉丁方设计拉丁方设计在水平和垂直两个方向都有双局部控制,使水平和垂直两个方向都成块,是比随机区组设计多一个块因子的设计。在拉丁方设计中,每行或每列都成为一个完整的区块,每个处理在每行或每列中只出现一次。也就是说,在拉丁方设计中,实验处理次数=水平区组数=直列区组数=实验处理重复次数。1.5.4析因设计析因实验设计又称全因素实验设计,属于多因素、多水平、单效应设计。既可以检验各因素、各水平之间的效果差异,也可以检验各因素之间的交互作用。交互作用是指一个因素不同层次之间的效果差异受到另一个因素的影响,包括协同交互作用和拮抗交互作用。析因实验主要用于分析交互作用。当因素和水平过多时,受试者、处理组和实验的数量都会大大增加,所以一般采用简单析因实验。多因素多水平的实验一般采用正交实验设计[5]。
2生物医学动物实验的描述性统计
2.1生物医学实验数据类型
生物医学实验中实验对象(动物)干预后测量的观察指标通常有以下几类:①连续数据:测量结果是具有数字大小和单位的数据,统计学上称为定量数据,如生理生化指标、体重、器官重量等。(2)分类数据:将测量结果按照一定的属性归入定性的类别,统计学上称为定性数据,可分为二元数据、多值标称数据和多值有序数据。反应出现或不出现,死亡或不死亡,有无畸形;病理损害的严重程度(无、轻度、中度、重度)等。
2.2统计描述指标
描述统计(或归纳统计)是对样本观察/测量数据的频率分布的定量研究。描述性统计的目的是:①对测量值或观察值进行总结和集中,并以统计学、统计图或统计表的形式表示出来;②估计总体分布的参数。2.2.1数据整理与探索对于某一测量指标,一般应从文献中知道其分布类型。如果没有判断概率分布的理论依据,就要用大样本重复测量,画出样本的频数分布图(理论上样本量大于100),通过统计检验拟合其分布。2.2.2数据的描述统计①连续数据的频率分布:通过编制频率分布表或制作样本数据的茎叶图,可以确定数据分布的类型、频率分布的集中趋势和离散趋势,可以估计总体参数,也便于发现异常值。②中心位置的描述性统计:描述数据分布的集中趋势,常用的指标有算术平均数、中位数、众数、几何平均数等。③离散度的描述性统计:描述数据分布的离散趋势,常用的指标有标准差和方差、极差和四分位数间隔、变异系数和离散系数等。④统计图:统计图包括连续数据分布的直方图和茎叶图、点条形图(绘制时的均值和标准差)和盒须图(绘制时的中位数、极差和四分位间距)、描述比率数据构成的百分位图和饼图、描述时变趋势的折线图、预测和检验分布类型的概率-概率图(P-P图)。统计表简单明了,易懂易比较。原则上,在编制统计表时,应重点突出,条理清晰,避免层次过多或结构混乱。一般的统计表应该是三线表,只有横线,没有竖线和斜线。统计表的标题应该清晰,不要太复杂。
3生物医学动物实验的假设检验
生物医学动物实验中最常见的情况是给定不同受试者后进行组间比较,通过统计学中的假设检验说明受试者的作用。假设检验时应注意以下问题。
3.1检验方法选择依据
3.1.1数据类型和变量个数要用不同的统计检验方法对不同类型的数据(定量和定性)进行比较。单变量和多变量的统计检验方法也不同。3.1.2实验设计类型应根据实验设计的具体类型选择相应的统计检验方法,从而得到治疗组效应的真实结论。3.1.3检验方法的前提条件在选择假设检验方法之前,我们要知道被分析的数据是否满足相应检验方法的前提条件。比如T检验、方差分析等参数检验方法要求数据满足正态性和方差齐性,2检验要求样本量大于40,理论频率大于5。
3.2正态性检验和拟合优度检验
统计假设检验必须确定样本的频率分布是否符合某种理论分布,如果符合要求,就可以按照这种理论分布进行统计处理。正态性检验可用于正态分布,拟合优度检验可用于其他分布。通常我们可以通过查阅文献来了解实验参数符合什么理论分布。
3.3方差的同质性检验
连续数据不满足参数统计分析前提的第二个原因是方差不均匀。一般来说,数值越大,其固有的可变性就越大。例如,如果一群动物的平均反应值是100,其数值范围可能是80 ~ 120;另一组动物的平均反应值为300,其数值范围可能扩大到240~360。解决方差不均匀的措施是数据转换。如果数据的标准差与平均值成正比,宜先将数据转换成对数值,再进行统计分析。据此,不仅数据的可变性与平均值无关,而且可以保证更符合正态分布。如果数据变异性的增加与平均值的关系不明显,通过平方根变换更容易使数据变异性与平均值无关。部分数据经过对数或平方根转换后仍可能存在方差不均匀的情况,此时应采用非参数检验。
3.4单边检验和双边检验
选择单面检查还是双面检查,要提前根据专业知识做出选择。一般来说,如果研究的目的只是为了了解组间是否存在差异,实验者无法预测组间变化的方向,实验者希望获得正反两方面的结果,则应采用双侧检验。如果组间差异的变化方向可以提前预测,实验者只对某一方面感兴趣,实验者只想知道与对照组的差异是正还是负,那么就应该采用单侧检验。此外,剂量设计预试验应采用双边试验,了解相关信息后正式试验可采用单边试验。
3.5多重比较和多重问题
生物医学实验经常比较治疗组和对照组之间的多个变量。即使没有真实的实验效应,也可能纯粹出于偶然,在5%的检验水平上,一个或多个变量存在显著差异。除了上述均值的多重比较导致I类错误概率增加的多重性问题外,其他多重性问题还包括多个中期分析、关注多个结果、亚组间多重比较等。处理多重性问题的原则包括:①提前规划多重比较;②限制比较次数;(3)多重比较采用更严格的边界标准;④多重比较有生物学基础。
3.6观察值或实验对象的独立性
许多统计检验方法要求观测值或实验对象相互独立,如比率检验、t检验和二项分布的方差分析等。但是,在一些生物医学实验中,观察单元并不是独立的。例如,生殖发育研究中存在巢效应:由于遗传因素、宫内发育环境和药物代谢环境的相似性,同窝仔对毒性作用的反应概率与同窝仔相比趋于系统化,即同窝仔中的数据为聚集数据,是常见的非独立数据。在统计分析中,忽略数据的巢内相关性有潜在的风险;因为K个同窝仔的观测值都是* * *,所以他们提供的信息还不如来自不同母亲的K个同窝仔提供的信息。嵌套中的相关性越大,包含的信息就越少。聚合数据的平均标准误差小于独立数据的平均标准误差。因此,如果统计分析方法是基于独立的观测值,则犯I类错误的概率会增加,即假阳性的风险会增加,实验的有效性会降低。
3.7历史控制数据的应用
在某些情况下,特别是在低发病率的情况下,单个研究可能提示治疗可以影响肿瘤的发病率,但不能得出明确的结论。一种可能的分析方法是将治疗组的数据与来自其他研究的对照动物的数据进行比较。虽然历史比较数据意义重大,但值得强调的是,由于多种原因,不同研究之间的变异程度大于研究内的变异程度。动物来源、饲料和饲养条件、研究周期、研究中的动物死亡率、读片的病理学家等。都可能影响肿瘤的最终发病率。因此,忽略这些差异,将治疗组与联合对照组的肿瘤发生率进行比较,可能会导致严重的错误结果,进而明显夸大统计显著性水平。Tarone[4]回顾了历史对照组的比率数据分析。
3.8假设检验的局限性
首先,假设检验中的p值不能提供关于治疗诱导效应大小的直接信息。某个受试者可以诱导一定量的反应增加,但这种增加是否具有统计学意义取决于研究的规模和数据的可变性。在小规模的研究中,有可能漏掉大的、重要的效应,尤其是检测终点的测量精度不高时。相反,在大规模研究中,较小的和不重要的影响具有统计学意义。例如,与药物C相比,药物D的降压作用近30mmHg,但由于病例数仅为10,假设检验未发现显著差异(P = 0.31)。相反,药物B的降压作用与药物A相比只有0.2mmHg,但由于病例数达到500例,假设检验发现有显著差异(P
;