疾病监测  2015, Vol. 30 Issue (7): 546-550

扩展功能

文章信息

张业武, 郭青, 张春曦, 王晓风, 于萌, 郑环, 苏雪梅
ZHANG Ye-wu, GUO Qing, ZHANG Chun-xi, WANG Xiao-feng, YU Meng, ZHENG Huan, SU Xue-mei
全国法定传染病报告率评估调查抽样方法设计
Sampling method for national notifiable communicable disease surveillance system assessment
疾病监测, 2015, 30(7): 546-550
Disease Surveillance, 2015, 30(7): 546-550
10.3784/j.issn.1003-9961.2015.07.006

文章历史

收稿日期:2014-08-26
全国法定传染病报告率评估调查抽样方法设计
张业武, 郭青, 张春曦, 王晓风, 于萌, 郑环, 苏雪梅     
中国疾病预防控制中心公共卫生监测与信息服务中心, 北京 102206
摘要目的 为获取全国医疗机构法定传染病报告率水平,研究制定相应的抽样方法和抽样方案。方法 利用2005年以来传染病报告率相关调查资料和传染病网络直报系统的传染病报告信息,根据分层整群多阶段抽样的理论和方法,分别计算总体样本、各层样本量、各阶段样本点数,并对计算结果进行归并,完成抽样框架设计。结果 最终确定本次调查的总样本量为1998例,按省级、地市级、县(区)级、乡镇级报告机构进行分层,每层内调查样本分别为270、540、864和324例;各层内分别采用3、4、5、6个阶段确定抽样调查样本点。调查范围覆盖9个省、27个地市、27个县(区)、54个乡镇,每个行政区划内随机调查1所对应级别的传染病报告单位。结论 本次调查首次将分层整群多阶段抽样应用到传染病报告率评估工作中。在抽样设计过程中,通过限制样本误差,增加置信度,在保证从调查样本到总体推断的精度同时,也减少了调查过程中的人力、物力和时间投入,大大提高调查效率,为今后开展类似工作提供参考。
关键词法定传染病报告    多阶段整群抽样方法    报告率    
Sampling method for national notifiable communicable disease surveillance system assessment
ZHANG Ye-wu, GUO Qing, ZHANG Chun-xi, WANG Xiao-feng, YU Meng, ZHENG Huan, SU Xue-mei     
Center for Disease Surveillance and Information Services, Chinese Center for Disease Control and Prevention, Beijing 102206, China
Abstract:Objective To understand the national reporting level of notifiable communicable diseases in hospitals included in national notifiable communicable disease surveillance system, the sampling method and protocol were designed. Methods Based on data from the previous studies on the reporting rates of communicable diseases since 2005 and the data from national notifiable communicable disease surveillance system, the sampling protocol was designed according to the theory and methods of multistage stratified cluster sampling and the overall sample size, sample size of each stratum, sample points at each stage were calculated. Results The total sample size was 1998. All the samples were in four strata: provincial hospitals (n=270), prefecture hospitals (n=540), county hospitals (n=864), and township hospitals (n=324). According to the design of the study, the hospitals were randomly selected from 54 townships in 27 counties in 27 prefectures in 9 provinces. Conclusion It was the first time for us to use multistage stratified cluster sampling method to conduct communicable disease reporting rate assessments. To avoid sampling error, a higher degree of confidence was set to ensure the accuracy and reliability of sampling inference. Thus, the manpower, resources and investigation time were reduced and the efficiency of investigation was improved.
Key words: Notifiable communicable disease reporting    Multistage cluster sampling method    Reporting rate    

为加强传染病预防和控制工作,提高居民健康水平, 2012年10月国务院编制印发卫生事业发展“十二五”规划将“法定传染病报告率≥95%”作为规划的目标之一。为更好实现该规划目标,需要对规划指标当前水平进行初步评估,发现可能存在的问题,并提出针对性的解决方法。为使评估调查工作更加科学合理,笔者参考了既往国家卫生服务总调查和结核病流行病学调查等调查方案和抽样方法[1],依据分层整群多阶段抽样的理论和方法[2, 3],确定全国法定传染病报告率达标情况抽样方法并制定相应的抽样方案,现将主要结果报告如下。

1 材料与方法 1.1 材料来源

全国各级各类医疗机构法定传染病报告率调查样本估计主要利用了20052012年间传染病报告率相关调查评估[4, 5, 6, 7, 8, 9]以及2012年度网络直报系统中各级医疗机构传染病报卡情况等相关资料。

1.2 抽样设计原则和方法

根据既往的督导检查结果,省、市、县、乡镇级别传染病报告率存在比较明显的差别,但在不同级别内部,机构间报告率差别不大;传染病诊断能力、实验室检测能力在各级别医疗机构间存在较大的差别;同时东中西部地区也同样存在着差别[4, 5, 6, 7, 8, 9]。根据2012年网络直报系统报告数据的统计结果,共有67 684所医疗机构参与传染病报告;省级、地市级、县(区)级和乡镇级医疗机构(社区卫生服务中心)各级别机构数、平均报卡数存在较大差别;省级、地市级、县(区)级医疗机构对传染病报告的贡献率比较大。因此,在抽样框架设计过程中,主要遵循如下原则:保证获得正确的信息;尽量做到省时、省力、省钱;充分利用已知的信息来提高抽样的精度;考虑抽样设计与后续数据收集和分析方法配套以及既往调查数据的连续性[2, 3]。为此,根据文献和专家建议,确定采用多阶段整群抽样方法进行抽样设计,具体步骤和方法如下。

图 1 分层多阶段整群抽样设计过程 Figure 1 Design of stratified multistage cluster sampling

第一步:利用单纯随机抽样方法估计总样本量

根据调查目的,采取WHO推荐的公式[10, 11],对本次调查所需的总样本量进行估计:

式中,n为总样本量,Z为1-α/2信度水平下Z统计量,P为期望率或比例,d为精度水平,即允许的绝对误差水平,deff为设计效率因子。

第二步:按照Neyman最佳配置原则对样本进行分层分配

将调查总体(病例报告数)按填报医院的等级(省、地市、县区和乡镇)特征分成4个不同层次(strata),采用分层抽样(stratified sampling)方法,按照Neyman最佳配置原则,确定每层抽样调查的病例数[2]。Neyman最佳配置的样本容量的分配公式为:

式中,Mh为第h层样本数,Nh为h层总报告病例数,σh为h层样本标准差,n为总样本量。

第三步:完成各层应抽样调查医疗机构数估计

利用既往调查研究数据的分析结果,按照以下样本计算公式[12],估计各层应抽样调查最小机构数(样本点)。

式中,V为层间方差,n为样本数,p为总样本率,pi为第i层样本率,Δ为允许误差,t为1.96。

第四步:完成对各层不同阶段样本点(群数)估计[12]

不同层内采用不同阶段进行抽样(表 1)。如在省级医疗机构内调查病例,采用三阶段抽样方法:第一阶段,在全国31个省、直辖市、自治区范围内选择抽样省;第二阶段,在抽样省内选择省级抽样医疗机构;第三阶段,在省级抽样医院内选择调查病例样本。在乡镇级医疗机构内调查病例,采用六阶段抽样方法,第一阶段,在全国范围内选择抽样省;第二阶段,在抽样省内选择抽样地市;第三阶段,在抽样地市内,选择县(区);第四阶段,在抽样县(区)内,选择乡镇/社区;第五阶段,在抽样乡镇内选择乡镇/社区医院;第六阶段,在抽样医院内选择病例样本。

表 1 不同层内样本抽样阶段 Table. 1 Sampling stages at different strata
分层抽样方法
省级第三阶段抽样(省→省级机构→病例)
地市级第四阶段抽样(省→地市→地市级机构→病例)
县(区)级第五阶段抽样(省→地市→县区→县区级机构→病例)
乡镇级第六阶段抽样(省→地市→县区→乡镇→乡镇机构→病例)

根据现有抽样调查结果,利用多阶段整群抽样的方差和样本点计算公式,分别计算省级、地市级、县(区)级、乡镇级等四个层的各阶段整群抽样的样本大小。以三阶段抽样为例,整群抽样各级方差估计公式如下[12]

式中,V1、V2和V3分别为一级、二级和三级群间方差,最后一级群间方差也就是群内方差。n、m和k分别为一级、二级和三级群内抽取的样本数,总样本数为n*m*k。p为总样本率,pi为一级群第i个样本率,pij为第i一级群内第j个二级群样本率,qij=1-pij

整群抽样样本点计算公式如下[12]

一级单位群抽取群数:

二级单位群抽取群数:

三级单位群抽取群数:

式中,N、M和K分别为一级群总数、一级群内二级群平均数以及二级群内三级群平均数,Δ为允许误差,t为1.96。

第五步:总体抽样框架设计

依据整群抽样样本点计算公式计算结果各阶段理论样本点大小,并综合考虑本次调查所能承受的人、财、物力、时间以及抽样的方便性等因素,最终确定各阶段实际调查样本点大小和抽样病例数,对不同层、不同阶段的抽样进行归并,以保障调查工作的可行性。

2 结果 2.1 总样本量

根据总样本量估算公式(见公式1),设定Ⅰ类误差α=0.05,Z1-a/2=1.96, 期望报告率为95.0%,允许的绝对误差水平d=1.4%, 设计效率因子deff=2.0,则总样本量n为1862。

2.2 样本分层分配结果

按Neyman最佳配置方案(公式2),对总样本量进行分层分配,结果见表 2

表 2 按Neyman最佳配置各层应抽样调查病例数 Table. 2 Sample size at each stratum based on Neymans optimal allocation
机构级别机构数报卡数标准差加权标准差比例各层应调查病例数
(1)包括乡镇卫生院和社区服务中心。
省级9651 178 3930.199 392234 961.613.31248
地市级3 5662 697 3560.170 863460 877.026.11486
县区级16 1704 107 6270.196 018805 168.245.61849
乡镇级(1)46 9831 557 4590.169 700264 300.414.97279
合计67 6849 540 835-1 765 307.3100.001862
2.3 各层应抽样调查医疗机构数估计

综合2009和2012年调查历史数据,按照各层样本点计算公式(公式3、4),对各层应抽样调查医疗机构数进行估计为67 684,结果见表 3

表 3 各层应调查医疗机构数估计 Table. 3 Sample sizes for hospitals at different strata
层级机构数(N)报告率(P)一级群间方差(V1)允许误差(Δ)医疗机构数(n)精度(%)
省级 9650.95 9060.004 1220.045895.31
地市级3 5660.95 9060.010 7350.0452195.31
县区级16 1700.95 2270.009 5120.0451995.27
乡镇级46 9830.96 1860.028 7980.0455795.32
2.4 各阶段样本点估计

基于历史调查数据,利用多阶段整群抽样样本点计算公式[12](公式5~10)分别计算省级、地市级、县(区)级、乡镇级等四个层的各阶段整群抽样的样本大小。由于历史资料的局限,部分层内误差无法获取,为此在计算其下一层次样本点时,将该层最大抽样点限制为1,分层各阶段样本点估计结果见表 4

表 4 分层各阶段最低样本点估计结果 Table. 4 Minimal sample sizes at different stages for each stratum
抽样阶段 按医疗机构等级分层
省级地市级县(区)级乡镇级
省数n5.469 28.972 87.702 916.065 9
地市级m-111
县(区)级k--11
乡镇级l---1
层内机构数o0.169 060.706 951.057 720.319 24
每机构病例数m13.088 609.490 7012.049 502.951 53
2.5 抽样框架

由于表4计算结果是在没有考虑总体样本量的情况,根据既往调查结果,所计算的各层各阶段在理论上应抽样的最小样本点数。为此根据本次调查需要,对各层各阶段的理论样本大小进行调整,主要采用整体扩增的方法,满足整体调查要求。但对乡镇机构所需的省份数进行缩小,即理论上需要在16个省份选择乡镇卫生院或城市社区服务中心才有代表性,但考虑到县级以上医院机构为传染病的主要报告单位,而近5万家乡镇级医疗机构报告传染病报告卡仅占16.32%,同时兼顾调查成本,故本次调查选择9个省份开展。最终确定的抽样框架,见表 5

表 5 调整后各层分阶段样本点和病例分布情况 Table. 5 Adjusted total sample sizes at different stages for each stratum
抽样阶段 按医疗机构等级分层
省级地市级县(区)级乡镇级
省级n9999
地市级m-333
县(区)级k--11
乡镇级l--- 2
机构数o1111
病例数p3020326
病例合计270540864324
3 讨论

本文采用多阶段分层随机抽样方法,并根据历史评估调查数据和网络直报系统中传染病报告卡统计信息,完成了对全国法定传染病报告率达标情况调查所需要的总体样本量、调查范围、各层和各阶段所需的样本量和样本点估算,并在此基础上制定了抽样方案,为全国法定传染病报告率达标情况调查方案的制定和实施提供了技术保障。通过现场调查实施,证明了采用多阶段分层随机抽样方法,不仅明显缩短调查时间,而且减少人力物力的投入。由于在抽样过程中,充分考虑到样本误差,设置较高的置信度,保证了从调查样本数据对整体情况的推断具有较高的精度和可信度。

在抽样过程中,对抽样可能造成的风险进行分析,并采取了应对措施,具体包括以下基本方面:

(1)抽样框架设计所依赖的数据为历史调查,且为非随机抽样数据,可能高估或低估实际抽样误差,导致样本量和样本点估计不准确。为此我们将设计效率因子deff设置为2,增加总体样本量。

(2)乡镇级机构调查的省级样本点和机构数均低于理论要求,使获得乡镇级机构真正报告率的把握度降低。但因乡镇级医疗机构对传染病报告的贡献率不高,为此增加乡镇机构的调查病例数。

(3)抽取的医疗机构仅限于各省在传染病报告信息管理系统中维护的医疗机构,对于未维护进系统中的机构无法抽取,因此建议开展民营、私营、村卫生室、门诊部等机构的专题调查。

另外对于非抽样造成的风险,如各类医疗机构对传染病报告的重视程度不同,如传染病诊断标准的培训、门诊日志和出入院登记本的登记质量,特别是不填写明确诊断等情况,我们在调查方案中增加查看医生处方和实验室特异性检测结果的调查内容,作为主要调查内容的补充。

本次调查首次将分层整群多阶段抽样应用到传染病报告率评估工作中。在抽样设计过程中,通过充分利用样本误差,增加置信度,保证了统计推断的准确性和可靠性。通过现场调查证明,采用分层整群多阶段抽样设计,减少了调查过程中的人力、物力和时间投入,大大地提高了调查效率,为今后全国或各省开展类似调查工作提供参考。

参考文献
[1] Zheng SH, Duanmu HJ, Zhao FZ, et al. Sampling methods for epidemiologcial study of tuberculosis[J]. Chinese Journal of Anti-tuberculosis,2003,25(6):397-399. (in Chinese) 郑素华,端木宏谨,赵丰曾,等. 结核病流行病学调查抽样方法介绍[J]. 中国防痨杂志,2003,25(6):397-399.
[2] Cochran WG, Zhang YT, Wu H. Sampling techniques[M]. Beijing: China Statistics Press,1987.(in Chinese) Cochran WG,张尧庭,吴辉.抽样技术[M]. 北京: 中国统计出版社, 1987.
[3] Lu XG. Courses for statistics[M]. Beijing: Tsinghua University Press Limited,2006.(in Chinese) 卢小广.统计学教程[M]. 北京: 清华大学出版社有限公司,2006.
[4] Liu SW, Wang LP, Wang XF, et al. Evaluation on management and quality of communicable diseases network direct reporting in China, 2009[J]. Disease Surveillance,2011,26(5),392-397. (in Chinese) 刘世炜,王丽萍,王晓风,等. 2009年全国传染病网络直报管理与报告质量现状评估[J]. 疾病监测,2011,26(5):392-397
[5] Wang LP, Guo Y, Guo Q, et al. Evaluation on quality of internet-based reporting of notifiable communicable diseases in China, 2005-2008[J]. Disease Surveillance,2010,25(11):912-914. (in Chinese) 王丽萍,郭岩,郭青,等. 2005-2008年中国法定传染病网络直报质量评价[J]. 疾病监测,2010,25(11):912-914.
[6] Guo Q, Zhang CX, Ji YB, et al. Investigation of infectious disease direct reporting network management in Chinese medical institutions[J]. Disease Surveillance,2010,25(5):410-413. (in Chinese) 郭青,张春曦,姬一兵,等. 中国医疗机构传染病网络直报管理工作现状调查[J]. 疾病监测,2010,25(5):410-413.
[7] Wang LP, Guo Q, Zhang CX, et al. National investigation into and analysis of hepatitis B reporting quality in 2006[J]. Chinese Journal of Disease Control and Prevention,2009,13(1):69-71,102. (in Chinese) 王丽萍,郭青,张春曦,等. 2006年全国乙型病毒性肝炎报告质量调查分析[J]. 中华疾病控制杂志,2009,13(1):69-71,102.
[8] Wang LP, Guo Y, Guo Q, et al. Quality evaluation of infectious diseases information based on internet reporting system in 2006[J]. Disease Surveillance,2007,22(6):412-414. (in Chinese) 王丽萍,郭岩,郭青,等.2006年全国法定传染病网络报告信息质量评价[J]. 疾病监测,2007,22(6):412-414.
[9] Shi XM, Ma JQ, Wang LP, et al. An investigational analysis of missing reports of notifiable diseases in medical facilities all over China in 2005[J]. Disease Surveillance,2006,21(9):493-496. (in Chinese) 施小明,马家奇,王丽萍,等. 2005年全国医疗机构法定传染病漏报情况调查分析[J]. 疾病监测,2006,21(9):493-496.
[10] Lwanga SK, Lemeshow S. Sample size determination in health studies: A practical manual[M]. World Health Organization,1991.
[11] Naing L, Winn T, Rusli B. Practical issues in calculating the sample size for prevalence studies[J]. Archives of Orofacial Sciences,2006,1(1):9-14.
[12] Huang TQ. Sample size estimation for multistage cluster sampling[J]. Chinese Journal of Health Statistics,1997,14(6):17-19. (in Chinese) 黄体乾.多级整群抽样样本大小的简便估计[J]. 中国卫生统计,1997,14(6):17-19.