说起病例对照研究,相信大家都不陌生。简单来说,我们以一组患有某种疾病的患者作为病例组,另一组无疾病的可比个体作为对照组。通过比较两组中我们关心的暴露因素的比例,可以推断出暴露因素与疾病的关系。
在这一点上,我们不得不提到保证病例组和对照组可比性的独特诀窍——匹配!一般来说,匹配包括频率匹配和个体匹配。前者只需要保证匹配因子在两组中的分布比例相同即可。比如病例组是半男半女,对照组应该是一样的;后者要求病例组中的每个受试者与对照组中具有相似或一致匹配因子的受试者相匹配。比如病例组有一个23岁的男性,对照组要给他配一个23岁的男性。
在本期中,我们将学习如何使用SPSS将病例与对照1:1进行匹配。
需要注意的是,SPSS22及以上版本只提供了案例控制匹配的功能,其他版本必须安装相应的插件才能使用该功能。这次用SPSS22给大家演示。
一、问题和数据
目前,关于吸烟与高血压的关系仍有争议。拟采用晁的病例对照设计(高血压组和正常组)探讨吸烟与高血压的关系,其中对照组与病例组按年龄2岁及同性配对。匹配前的现有队列数据是这样的(见表1)。可以看出,匹配前两组的性别分布和年龄存在明显差异。我们来看看SPSS如何匹配!
表1 .两组基线比较(匹配前)
二、SPSS分析方法
1.数据输入
(1)可变视图
(2)数据视图
2.病例对照匹配
选择数据→病例对照匹配,进入病例对照匹配主对话框。
需要将变量(年龄、性别)匹配到要匹配的变量中;
匹配容差用于设置匹配条件。一般分类变量要求相同,设置为“0”。对于连续变量,可以根据具体情况定义一个范围。例如,这里我们将年龄限制为2岁,并将其设置为“2”。但需要注意的是,设置匹配条件必须与匹配变量的放置顺序一致,并以“空网格”分隔。
组指示器指定分组,一般病例组指定为“1”,对照组指定为“0”;
案件ID决定了被观察对象的ID,一般是案件编号和侦查代码;
匹配标识变量的名称设置一个变量,以明确控制组中成功匹配的标识;
匹配组变量的名称设置一个变量来识别病例组中条件相同的观察对象,如两个23岁的男性。
3.选项设置
合格案例数的变量设置一个变量,用于指定案例组中有多少观察者满足匹配条件。比如病例组有23岁男性,对照组可能有24岁男性和22岁男性。
采样默认为不放回样本。
优先选择精确匹配,也就是说病例组有一个23岁的男性,对照组要找一个23岁的男性与之匹配。
最大化执行性能执行优化操作。
在画匹配时随机化格序在这里,我们需要注意。在整个匹配过程中,如果对照组中有多个符合匹配条件的观察对象,SPSS默认会随机将其与病例组中的观察对象进行匹配。问题来了,因为SPSS默认给控制组的随机数对于每次操作都是不一样的,所以如果不是专门设置的,那么每次匹配成功的对是不一样的,也就是说这次控制组A匹配到案例组B,下次可能匹配到案例组c,所以需要在这里勾选,在随机数种子中设置一个随机数种子,保证匹配过程可以重复。
4.附加输出设置
这里,成功匹配的控制组中的所有观察对象都作为数据集控制输出。强烈建议您在这里检查和设置。有什么用?接下来再说吧~
三、匹配结果
1.匹配过程
如表2所示,精确匹配28对,模糊匹配178对,共成功匹配206对。
表2 .匹配统计
表3主要是匹配过程。第一种是精确匹配(年龄性别相同),匹配23170次,匹配成功不到1%;其次,在精确匹配成功的前提下,进行了年龄(年龄2岁)的模糊匹配,共进行了23142次匹配,约6.5%的匹配成功;最后,在以上两次匹配成功的前提下,进行了Sex的模糊匹配(本例中为同性),共进行了1501次匹配,约有12%的匹配成功。
表3 .匹配公差
2.匹配的数据库
以前设置的几个新变量出现在原始数据库中:
E_case表示对照组中有几个匹配对象(如图,病例组ID=25,对照组中有4个匹配对象);Match_G与E_case不同,Match_G的个数相同,说明病例组的匹配条件是一致的,比如有几个23岁的男性观察对象需要匹配;Match_ID表示控制组匹配成功的ID。
下图输出只包含匹配成功的对照组的数据库,Match_G与原数据库一致,match_ID表示匹配成功的对应病例组的ID。
3.数据库整合
这里有朋友要问,两库之后怎么做数据分析?重点来了,数据库的合并!
(1)生成案例组数据集:在原数据库中,选择数据→选择案例→如果条件满足:设置match_id≥1,过滤出匹配成功的案例组→输出新的数据集案例。
(2)控制数据集中match_ID替换:用ID号替换控制数据集中的变量match _ ID→保存
(3)合并病例组和对照组数据集:在新生成病例数据库的SPSS界面下,选择数据→合并文件→添加病例→选择对照组→继续→确定
(4)排序&:保存:选择数据→排序案例→按match_id排序→确定→保存(记得保存劳动成果!!!)
你说完了,但我们得看看匹配结果。见表4。所有高血压组均匹配成功,两组性别和年龄平衡,具有可比性。
表4 .两组基线情况比较(匹配后)
问题又来了。匹配成功。怎么做数据分析?推荐你看:SPSS示例教程| 1:m匹配病例对照Logistic回归
四.总结和扩展
有些朋友可能会问,这是一个1:1的病例对照试验,但是1:M呢?这个对SPSS大哥来说有点难!目前SPSS中的病例对照匹配只提供1:1的病例对照匹配,不过不用担心,后面我们会用SAS演示1:M病例对照匹配,敬请期待~ ~ ~
1.《spss数据录入 SPSS操作:搞定病例与对照的1:1匹配》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《spss数据录入 SPSS操作:搞定病例与对照的1:1匹配》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/guonei/1490482.html