您的当前位置:首页正文

医学论文中统计分析错误辨析与释疑_13_实验设计原则的正确把概要

来源:好兔宠物网


・争鸣与教育・

作者单位:100850北京,军事医学科学院生物医学统计咨询中心(胡良平、李子建;首都医科大学继续教育学院(刘惠刚

医学论文中统计分析错误辨析与释疑(13 ———实验设计原则的正确把握 胡良平 李子建 刘惠刚 一、随机原则及其作用

在进行实验设计时有四个基本原则,即随机、对照、重复和均衡。何为随机原则呢?就是在选取样本时,应确保总体中任何一个个体都有同等的机会被抽取进入样本;在分配样本时,应确保样本中任何一个个体都有同等的机会被分入任何一个组中去。这就是严格意义上的随机化原则。

随机原则的作用是什么?其作用就是使样本具有极好的代表性,使各组受试对象在重要的非实验因素方面具有极好的均衡性,提高实验资料的可比性。

完全随机化的效果是否永远最好?不一定。关键取决于样本含量的大小。若样本含量很大,完全随机化的效果应当是比较理想的;若被随机化的样本比较小,则完全随机化产生的各组受试对象之间在很多重要的非实验因素方面可能参差不齐。此时,采取分层随机化法效果会更好一些。即先按某些重要的非实验因素(取决于他们是否对观测指标有较大影响将受试对象分组,然后对每个小组(在所考虑的重要非实验因素上条件一致中的受试对象进行完全随机化,使他们被均分到各实验组中去,这样才能确保各实验组中的受试对象之间在所考虑的重要非实验因素方面保持均衡一致。例如:现有24只小鼠,其中16只雌性,8只雄性,若采用完全随机化方式将他们均分成2组,则有可能某一组中的12只小鼠全是雌性的,另一组中有4只雌性、8只雄性小鼠。若果真出现这样的分组结果,当小鼠性别对观测结果又有较大影响时,“性别”这个重要的非实验因素就严重地影响了实验因素两个水平(处理组与对照组对观

测结果效应大小的正确评价,甚至易于得出歪曲事实的结论来。此时,宜采用“分层随机化”,就本例而言,先用完全随机化法将16只雌性小鼠随机均分成两组,实验组和对照组各8只;再用

完全随机化法将8只雄性小鼠随机均分成两组,实

验组和对照组各4只。这样,实验组和对照组都各有12只小鼠,其中雌性和雄性小鼠分别为8只与4只,即“性别”这个重要的非实验因素在实验组和对照组中所施加的影响是均衡的。

实现随机化的做法有哪些?实现随机的方法有多种,可以查“随机数字表”、“随机排列表”或查“用计算机产生的伪随机数字表”等来实现。

二、违背随机原则的实例

例1 某研究者在进行大剂量甲氨蝶呤静滴后四氢叶酸钙解救方案的探讨时采取了如下的做法:两种解救方案用于治疗急性淋巴细胞白血病患儿,一种方案为总剂量3g/m 2大剂量甲氨蝶呤(HDM TX 在12h 静脉滴注完毕,施药36h 后进行四氢叶酸钙(CF 解救(简称方案Ⅰ

;另一种方案为在24h 静滴完毕,施药36h 后进行CF 解救(简称方案Ⅱ

。比较血液及脑脊液中的药物浓度。选择的研究对象是1998年5月至1999年2月住院的急性淋巴细胞白血病患儿17例,平均714岁,男11例,女6例。在17例患儿中,13例患儿第一疗程接受方案Ⅰ,以后在连续进行的2个疗程中均接受方案Ⅱ治疗,计26例次;另4例患儿只接受方案Ⅱ1次。比较时将所有接受方案Ⅰ的患儿(n =13的药物浓度与所有接受方案Ⅱ(n =26+4的患儿的药物浓度进行比较。

对差错的辨析与释疑:从上面可以看出,原作者在进行实验分组时具有很大的随意性,13例患儿既接受了方案Ⅰ的治疗,又接受了两个疗程的方案Ⅱ的治疗,没有考虑经过两个不同方案治疗对观察指标可能带来的影响,且13例患儿两个疗程方案Ⅱ所测得的26个数据被错误地看成取自26个独立的个体,又与其他只参加第Ⅱ方案治

疗的4个个体的数据组成一组进行计算。接受第Ⅰ方案治疗的患儿的数据来自第一疗程,而接受第Ⅱ方案的患儿的数据大部分来自第二疗程(即有13+4=17例次和第三疗程(即有13例次,可比性较差。重复测自13个

患儿的26个实验数据被看成测自26个患儿的独立数据,显然不妥。

针对此项临床试验研究,可考虑采用交叉设计,一个实验因素是治疗方案,另外两个重要的非实验因素是受试对象和测定顺序。每人在两个疗程中各用不同的方案一次,条件最接近的每2人配成一对,用随机的方法确定每对中之一接受方案Ⅰ、Ⅱ的顺序(可通过SAS程序产生,另一人的顺序相反。这样可以尽可能消除人为因素的影响,精确地控制误差,分析出各因素的效应,得到较为可信的结果。

例2 一些临床医生常常根据患者来院就诊的先后顺序对他们进行分组,即将先来的10例患者分入对照组,将中间来的患者分入A药组,将最后来的10例患者分入B药组。这样分组合适吗?

对差错的辨析与释疑:这样做看起来似乎是随机的,其实,分入各组的患者可能在病情等某些重要的非处理因素上相差很多,因为在某一段时间内人们可能容易患某病,其中有些患者对健康问题特别关注,经济上和时间上也都比较宽裕,因此,只要感觉有点不舒服就可能会去看医生;与此相反,有些患者只有等到病重得坚持不下去了才去看医生。也就是说,在某一段时间内,患者来医院就诊的先后顺序中,可能暗含着病情轻重不等的因素,按“先后顺序”分组的结果,很可能造成某些组内重症者居多,而另一些组内轻症者居多。在未进行实验研究之前,各组患者在“病情”方面的差别就已存在了,没有通过“随机化”方法尽量降低重要非实验因素对观测结果的影响,同时也就严重地违背了实验设计中的“均衡原则”,其实验结果的可靠性必然要受到影响。

例3 某研究者在《小剂量干扰素加三氮唑核苷治疗流行性乙型脑炎99例分析》一文中有如下的做法:在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎99例,采用同期的、接受一般治疗的73例该病患者作为对照。治疗组中轻型29例,普通型40例,重型22例,极重型8例;对照组73例,轻型18例,普通型32例,重型17例,极重型6例。两组患者均采用传统降温、镇静、降颅内压、

肾上腺皮质激素及抗生素预防感染等对症治疗。在此基础上治疗组选择发病在5d以内的患者,加用干扰素和三氮唑核苷静滴,疗程5~7d。两组比较疗效差异有显著意义,结论是在一般治疗的基础上加用小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎的疗效优于一般治疗的疗效。

对差错的辨析与释疑:原作者在比较时考虑到了病情的严重程度可能是影响疗效的一个影响因素,因此在两组中对病情严重程度作了安排,经卡方检验,两组在病情严重程度的构成上的差异没有显著意义,好象具有了可比性。其实不然,作者人为地选择发病在5d以内的患者进入治疗组,而对照组则没有此限制,根据常识,早期治疗对疾病的预后具有重要影响,往往具有较高的治愈率和较低的病死率。因而治疗组和对照组由于人为因素的干扰和影响,在病程这一重要的非实验因素上并没有达到均衡,不具有可比性。

在制定实验设计方案时,应将重要的非实验因素考虑在内,用随机化法使各组患者在重要的非处理因素上尽量达到均衡一致,以便提高组间的可比性。正确的做法是对照组也应选择发病在5d以内的患者,并在实验分组时遵循随机的原则,以使患者都有相同的机会进入治疗组和对照组。在样本含量并非很大的情况下,若按病情等重要非实验因素进行分层随机化,可能更为合适。这样才能较好地体现出加用干扰素和三氮唑核苷的治疗效应。

例4 某临床医生在其投稿的论文中这样写道:自1996年11月至2000年3月,采用手术治疗合并重度肺动脉高压先心病患儿34例,男22例、女12例。患儿根据手术时间分为对照组(1998年8月前和肺保护组(1998年8月至2000年3月。观察血管内皮eNOS、支气管上皮iNOS、巨噬细胞iNOS(%。

对差错的辨析与释疑:这显然是在进行临床资料的回顾性分析,而不是前瞻性研究。人为地将所考察的患者按就诊的先后顺序分成前、后两个阶段,分别叫做对照组和肺保护组。这在受试对象的分组问题上严重地违背了随机化原则,两组患儿在许多重要非实验因素方面的均衡性很差,其实验结果之间可比性很差,即使对实验结果做统计分析,也没有什么说服力。

三、介绍临床试验中一种简便易行的随机化分组方法

在临床试验研究中,常习惯将患者分为实验组与对照组。若将先来就诊的患者分入实验组,后来就诊的分入对照组,这样做是不正确的,因为患者来医院就诊,在患病严重程度、患病时间等重要的非实验因素方面不一定是均衡的,可能带有某种程度上的“聚集性”,即某一段时间上来的患者多数为重病患者,另一段时间上来的多数为轻病患者;若规定第一个来就诊者分入实验组,第二个来就诊者分入对

照组,这样交叉进行分组,最后也可能两组患者在某

些重要的非实验因素方面相差悬殊,组间缺乏均衡性。有一种简便易行的随机化分组方法叫“按不平衡指数最小的分配原则”分组。

这个分组的方法如下:根据专业知识选取几个拟加以控制的重要非实验因素,假定一个是患者的“性别(分为男、女”,另一个是患者的“病情(分为轻、中、重”。将先来的两位患者在实验组与对照组各放一人,记下他们的性别和病情,记分的方法是每个因素的每个水平出现一次记1分,计算两组各因素对应水平的得分之差的绝对值,最后求出绝对值之总和,称此“和”为两组患者在两个重要非实验因素上的不平衡指数。若再来第三位患者,分别依次将此患者放入实验组、对照组各一次,每次都根据他(或她的性别、病情累加到原有患者的基础之上,可以得到两个不平衡指数,取不平衡指数最小的那种分组方法,这样第三位患者的分组就定下来了,用同样的方法去分配以后来的该病患者,直到两组有了事先规定的样本含量时就停止。现举例说明如下。

假定在对肩周炎患者分两组时考虑病情(轻、中、重,患病时间(短、长和日常运动量(少、多三个重要的非处理因素,再假定治疗组和对照组各有了一个患者,他们的基本情况如表1所示,第3位来的是一位新患者,病情重、患病时间短、日常运动量多,问将此新患者分入哪个组中去为好?

试着将新患者分别分入治疗组和对照组,取“不平衡指数”较小者所对应的分配方案,分别参见表2和表3。

表1 两例患者的基本情况及分组后的平衡程度 实验分组 例数 病情 (轻中重 患病时间 (短长 运动量 (少多 合计

治疗组0100110 对照组1001010

差的绝对值11011004 注:表中合计值“4”就是“不平衡指数”,下同 表2 将此名新患者分入治疗组后的平衡程度 实验分组 例数 病情 (轻中重 患病时间

(短长 运动量 (少多

合计治疗组0111111 对照组1001010

差的绝对值11101015表3实验分组 例数 病情 (轻中重 患病时间 (短长 运动量 (少多 合计

治疗组0100110 对照组1012011

将此名新患者分入对照组后的平衡程度

差的绝对值11121017因5<7,故本例应取表2作为分配结果,若再有新患者,分配方法相同。假如有k个(k≥2治疗组,可分别与对照组比较,分别求(k21个表中的“不平衡指数”,取其中最小者对应的分配方案。

(收稿日期:2004203226 (供稿编辑:李群

中华医学会第七次全国老年肝病及感染性疾病学术会议征文通知

经中华医学会批准,中华医学会传染病与寄生虫病学分会定于2004年10月召开第七次全国老年肝病及感染性疾病学术会议。具体时间、地点另行通知。征文内容:(1老年人病毒性肝炎的流行病学、病原学、病理、临床诊断治疗及预后的研究,(2脂肪肝的临床研究,(3肝硬化和肝癌及其并发症的研究,(4各种治疗肝炎药物疗效的评估,(5老年人感染性疾病的临床特点及治疗,(6老年患者医院内感染的研究,(7老年患者抗生素使用的研究。

征文要求:凡未在国内外刊物和全国性学术会议发表的论文均可投寄论文内容应体现先进性、科学性和具有理论实用价值。论文请寄800~1000字摘要一份(自留底稿。论文摘要应包括目的、材料和方法、结果、结论4个部分。摘要请寄打印稿并附软盘一张,也可从网上邮寄,Email:Lijiuyi @cma.org.cn。摘要请写明作者姓名、单位、邮编。稿件请寄:100710北京东四西大街42号中华医学会学术部李久一收。信封上注明“老年肝病会议征文”字样。截稿日期:2004年7月31日。

因篇幅问题不能全部显示,请点此查看更多更全内容