疾病监测, 2014, 29(3): 234-236
DOI: 10.3784/j.issn.1003-9961.2014.03.017
Application of multiple analysis with SPSS in survey of communicable disease reporting management
CHEN Wei, ZHAO Xiao-Jing, ZHANG Jie
Henan Provincial Center for Disease Control and Prevention, Zhengzhou 450016, Henan, China
Abstract
Objective To provide a statistical software to conduct multiple analysis in the survey of communicable disease reporting management. Methods SPSS software was used to implement the multi data entry, conversion and statistical analysis. Results According to examples, the method to produce multi data entry, transform coding and analysis with SPSS software was established. Conclusion The method is suitable for multi data entry, conversion and statistical analysis. The result is more complete and accurate.
Keywords:    multiple options   SPSS   communicable disease  

SPSS多选项分析在传染病疫情报告管理调查中的应用
陈伟, 赵晓静, 张杰
河南省疾病预防控制中心疫情管理信息中心, 河南 郑州 450016
收稿日期:2014-1-14
作者简介:陈伟,男,河南省周口市扶沟县人,主管医师,现从事疾病监测及防控工作
通讯作者:陈伟,Tel:0371-68089082,Email:chenwei0840@163.com
摘要
目的 针对传染病报告管理调查中多选项的分析问题,予以统计软件技术上的支持。方法 采用 SPSS 软件实现多选项资料的录入、转换和分析。结果 结合实例,给出了SPSS软件多选项的录入方式、转换编码和分析程序。结论 文中给出的方法能轻松实现多选项的录入、转换和分析工作,使得其分析结果更为全面和科学。
关键词:    多选项   SPSS   传染病  

内容大纲
1 数据来源
2 数据录入与转换
2.1 数据录入方式
2.2 两种录入方式的转换
3 定义多选项变量集
4 多选项的分析
4.1 多选项的频数分析
4.2 多选项的列联分析
5 讨论
  多选项,又称为多重应答(Multiple Response),即同一个问题的答案可以同时允许多个选项的存在。根据调查目的合理设置多选项,有助于确保调查信息的准确性和全面性,是一种极为常见的问题形式,在卫生服务领域得到广泛应用,在传染病疫情报告管理调查方面,不少调查数据可通过多选项分析来得出更为全面的分析结果。笔者根据“河南省2012年医疗机构传染病疫情报告管理现状调查”的例子就多选项在SPSS 15.0软件中的数据录入、转换和简单统计分析作一介绍,以供参考。
1 数据来源
  河南省疾病预防控制中心(CDC)于2012年12月对医疗机构传染病报告管理情况进行了调查,以了解辖区内医疗机构传染病报告管理现状,为制定下一步工作计划提供理论支持。本研究以河南省2012年医疗机构门诊日志项目设置情况为例来说明多选项数据的录入、转换与分析过程,表1是调查表中的几个问题。

表1 2012年河南省医疗机构传染病疫情报告管理状况调查表(部分)
Table 1 Questionnaire about management of communicable disease reporting medical institutions in Henan, 2012
…… 2、单位级别: 1)三级 2)二级 3)一级
…… 8、门诊日志项目设置是否规范: 1)是 2)否
 8.1 如不规范,缺失的项目为: 1)就诊日期 2)姓名 3)性别 4)年龄 5)职业
6)现住址 7)疾病名称 8)发病日期 9)初/复诊
……
  
2 数据录入与转换
2.1 数据录入方式
  在利用SPSS软件进行问卷处理时,对于单选题,因每题的答案只能为一个选项,因而可以将一道问题设为一个SPSS变量,如第二题可设变量名为“t2”,第八题为“t8”,但在多选项中,每道题都可能有一个以上的答案,不能被直接编码,需要将问题分解为多个问题,对应设置若干个SPSS变量。在SPSS中,对于多选项答案的标准录入方式有两种:一是多重二分法(Multiple dichotomy method),即把多选项的每个候选答案均看作一个变量来定义,每个变量只有“1”和“0”,分别代表“选”和“不选”;第二种是多重分类法(Multiple category method),即根据可能的答案数量来设置相应个数的变量,这些变量必须为数值型变量,且都是多分类的,每个变量代表一次选择。变量的数量应根据调查的目的和实际情况来确定,考虑到本次调查问卷回收后发现答案最多只有4个选项,因此只需要定义4个分类变量,每个变量的编码为9个。两种录入方式结果见表2。

表2 多选项标准录入方式示例
Table 2 Example of standard entry method of multiple options
变量 多重二分法 多重分类法
X1 X2 X3 X4 X5 X6 X7 X8 X9 Q1 Q2 Q3 Q4
记录100001001058
记录20000101115789
记录3000000000
  

  除上述两种标准录入方式外,还可用“原始编码录入法”录入数据,再将数据库转换为上述两种数据库模式 ,但其转换方式相对复杂,不利于初学者掌握。在实际操作中,因为大多数多选项的答案只是候选答案中的少数几个,我们基本都采用多重分类法录入数据,尤其是样本量较大时,可以明显提升工作效率。
2.2 两种录入方式的转换
  多重分类法录入方式只是一种简化记录方式,在本次调查中,如果被调查单位门诊日志项目设置齐全,则不需要录入数据,如表2中记录3,但如果利用多重分类法所建数据库进行分析,SPSS则视为记录缺失,这就要求我们把该数据库转化为符合统计分析原则的数据排列格式,即多重二分法录入格式。具体转换方法为:选择菜单File→New→Syntax,在弹出的Syntax对话框中输入以下命令:
COUNT
X1 = Q1 Q2 Q3 Q4(1).
EXECUTE.
  X1代表了是否选择“就诊日期”选项,如果在Q1~Q4中选择了1,则X1取值为1,否则为0;同理,X2代表了是否选择“姓名”选项,如果在Q1~Q4中选择了2,则X2取值为1,否则为0;以此类推,依次生成新变量X3~X9,输入变量标签,这样我们就把以多重分类法录入的数据库转化为了多重二分法录入格式。
3 定义多选项变量集
  将多选项分解以后,虽然我们可以对每个单独的变量来进行描述性统计分析,但无法计算一些汇总指标,SPSS可通过定义多选项变量集来对多选项进行比较完善的描述。具体方法为:选择菜单Analyze→Multiple Response→Define Vialable Sets,得到“Define Multiple Response Sets”对话窗口,将“Set Definition”框中的“X1,X2,X3,X4,X5,X6,X7,X8,X9”变量选入右边的“Variables in Set”框。在“Variables Are Coded As”框中选取“Dichotomies”(二分编码),在“Counts Value”框中输入二分值,本例选“0”,表示为“设有该项目”,即要计算项目的设置率,在“Name”框中输入多选项变量集名称“门诊日志项目”,然后按“Add”添加到右边的“Mult Response Sets”框,这样就定义了一个新的题集变量“门诊日志项目”。
4 多选项的分析
4.1 多选项的频数分析
  选择菜单Analyze→Multiple Response→Frequencies,得到“Multiple Response Frequencies”对话窗口,将“Mult Response Sets”中的备选变量“$门诊日志项目”选入“Table(s) for”框,点击“OK”,得到表3的整理结果。
  本次调查的36家医疗机构的门诊日志均设置有“就诊日期”、“姓名”、“性别”、“年龄”和“现住址”项目,28家设置有“职业”,占77.8%,35家设置有“疾病名称”,占97.2%,16家设置有“发病日期”,占44.4%,31家设置有“初/复诊”,占86.1%。
4.2 多选项的列联分析
  在本次调查中,如果想要了解不同级别医疗机构门诊日志项目设置情况,则需要对进行列联分析,具体方法为:选择菜单Analyze→Multiple Response→Crosstabs,出现“Multiple Response Crosstabs”对话窗口,将“Mult Response Sets”中的备选变量“$门诊日志项目”选入“Row(s)”框,将变量“t2”(医院级别)选入“Clumn(s)”,点击“Define Ranges”按钮,在“Minimum”后输入“1”,在“Maximum”后输入“3”,点击“Continue”,如果想得到各级医疗机构门诊日志各项目的设置率,则点击“Options”按钮,在“Cell Pertentages”框中选中“Clumn”,点击“Continue”回到“Multiple Response Crosstabs”对话窗口,点击“OK”,得到表4的整理结果。

表3 2012年河南省医疗机构门诊日志项目设置频数分布
Table 3 Frequency distribution of items in outpatient service logs of medical institutions in Henan, 2012
项目名称应设项目数实设项目数项目设置率(%)
就诊日期3636100.00
姓名3636100.00
性别3636100.00
年龄3636100.00
职业362877.78
现住址3636100.00
疾病名称363597.22
发病日期361644.44
初/复诊363186.11
  合计32429089.51
  

表4 2012年河南省医疗机构门诊日志项目设置与单位级别交叉列联表
Table 4 Contingency table for items in outpatient service logs and level of medical institutions in Henan, 2012
项目名称 三级医院 二级医院 一级医院
实设项目数 项目设置率(%) 实设项目数 项目设置率(%) 实设项目数 项目设置率(%)
就诊日期10100.0013100.0013100.00
姓名10100.0013100.0013100.00
性别10100.0013100.0013100.00
年龄10100.0013100.0013100.00
职业880.00969.231184.62
现住址10100.0013100.0013100.00
疾病名称10100.001292.3113100.00
发病日期660.00538.46538.46
初/复诊990.001184.621184.62
  

  由结果可以看出,本次调查的36家医疗机构中一级医疗机构和二级医疗机构分别为13家,三级医疗机构10家,其中门诊日志中 “职业”项目设置率最高的是一级医疗机构,为84.6%(11/13),其次是三级医疗机构,为80.0%(8/10),最低是二级医疗机构,为69.2%(9/13)。其余项目的结果解释在此不再赘述。
5 讨论
  多选项作为一种常见的题型,在传染病报告管理调查过程中经常用到,比如在传染病报告卡填写的完整性调查中,具体哪些项目填写的不完整就为一多选项,但目前一些调查仍停留在卡片是否完整的层次上 ,没有涉及各项目完整率以及不同文化程度医师间项目填报完整性的差异等指标的细化分析。SPSS 作为世界上通用的统计软件包之一,其采用多选项处理过程(Multiple Response)来实现多选项的分析,通过菜单、图标按钮和对话框等方式来完成所需要执行的命令,操作简单,易为基层工作者所接受。我们可以借助SPSS中多选项的频数分析和列联分析来完成上述分析。根据调查表题目设置的目的,对数据做适当的变换还可进行卡方检验等更深层次的分析。

参考文献
[1] Lin HS, Yang L, Xia SJ, et al. The encoding of multiple answers and the application of SUBSTR Function in SPSS[J]. Chinese Journal of Health Statistics, 2001, 18(6):371-373. (in Chinese) 林汉生, 杨丽, 夏苏建, 等. 多选题答案的编码与SPSS中SUBSTR 函数的使用[J]. 中国卫生统计, 2001, 18(6):371-373.
[2] Tao WD, Tao XL, Xie CX. A new method to realize the entry and conversion of the multiple-choice data in SPSS[J]. Statistical Education, 2008, 1:19-21.(in Chinese) 陶维东, 陶晓丽, 谢超香. 在SPSS中实现多选题数据录入、转换的新方法[J].统计教育, 2008, 1:19-21.
[3] Wang YL. An investigation of reporting quality of infectious diseases in Kaifeng city, 2010[J]. Chinese Journal of Health Statist ics, 2012, 29(1):103-104.(in Chinese) 王亚丽. 2010年开封市传染病漏报及报告质量调查[J]. 中国卫生统计, 2012, 29(1):103-104.
[4] Zhang P, Li CL, Zheng YQ, et al. Omission survey of infectious diseases reporting in medical institutions in Gaoxian, 2004-2010[J]. Parasitoses and Infectious Diseases, 2012, 10(2):95-98.(in Chinese) 张平, 李朝兰, 郑远秋, 等. 2004 2010 年高县医疗机构传染病漏报调查[J]. 寄生虫病与感染性疾病, 2012, 10(2):95-98.