疾病监测  2015, Vol. 30 Issue (7): 599-601

扩展功能

文章信息

刘伦皓, 李娜, 王丽艳, 罗映娟, 胡莹, 裴晓迪, 梁莉, 刘莉
LIU Lun-hao, LI Na, WANG Li-yan, LUO Ying-juan, HU Ying, PEI Xiao-di, LIANG Li, LIU Li
捕获-再捕获方法在四川省彭州市全死因死亡漏报评价中的应用
Application of capture and re-capture strategy in evaluation of underreporting of all death cause mortality in Pengzhou, Sichuan
疾病监测, 2015, 30(7): 599-601
Disease Surveillance, 2015, 30(7): 599-601
10.3784/j.issn.1003-9961.2015.07.019

文章历史

收稿日期:2015-01-29
捕获-再捕获方法在四川省彭州市全死因死亡漏报评价中的应用
刘伦皓1, 李娜2, 王丽艳3, 罗映娟1, 胡莹1, 裴晓迪1, 梁莉1, 刘莉1     
1. 四川省疾病预防控制中心, 四川 成都 610041;
2. 彭州市疾病预防控制中心, 四川 彭州 611930;
3. 中国疾病预防控制中心, 北京 102206
摘要目的 应用捕获-再捕获方法估计2012-2013年彭州市全死因死亡率,评价死亡漏报情况,同时对应用效果进行评估。方法 从死因监测系统、乡镇计划生育办公室、村委会3个途径获取2012-2013年常住人口在彭州市的全死因死亡记录。在不同来源的数据记录之间,用姓名、姓名拼音字母、性别、出生日期、居住乡镇进行匹配。采用连接函数为对数(log)的线性模型对3个样本进行拟合,估计全死因死亡人数。结果 应用捕获-再捕获方法估计全死因死亡人数13 594人(95%CI:13 537~13 651),死亡率为1.77%,高于网报登记死亡率1.41%和合并样本死亡率1.68%。捕获-再捕获方法估计的死亡人数作为分母,计算3样本合并后的漏失率为5.29%;死因监测系统漏报率为20.37%,高于样本合并后的死亡人数作为分母的死因网报漏报率(15.92%)。结论 任何一个样本,死亡记录都不完整,即使3个样本合并后仍然存在漏失的情况,捕获-再捕获方法可以用来校正由于死因监测系统漏报造成的误差,更准确地评价实际死亡水平。
关键词捕获-再捕获    死亡率    漏报率    
Application of capture and re-capture strategy in evaluation of underreporting of all death cause mortality in Pengzhou, Sichuan
LIU Lun-hao1, LI Na2, WANG Li-yan3, LUO Ying-juan1, HU Ying1, PEI Xiao-di1, LIANG Li1, LIU Li1     
1. Sichuan Provincial Center for Disease Control and Prevention, Chengdu 610041, Sichuan, China;
2. Pengzhou Prefecture Center for Disease Control and Prevention, Pengzhou 611930, Sichuan, China;
3. Chinese Center for Disease Control and Prevention, Beijing 102206, China
Abstract:Objective To understand the underreporting of all death cause mortality in Pengzhou, Sichuan province, from 2012 to 2013. Methods The all death cause mortality data among the local residents during this period were collected from local death cause surveillance system, township family planning offices and village committees. in Pengzhou the data from different sources were matched with the names, name's phonetic letters, sex, date of birth and living address of death cases. Log-liner model was used for fitting the data from 3 sources to estimate the all death cause mortality. Results By using capture and recapture strategy, it was estimated the all death cause mortality was 13 594 (95% CI: 13 537-13 651), and the mortality rate was 1.77%, higher than that in death cause registry (1.41%) and the average of samples (1.68%). By using the mortality estimated by capture and recapture strategy as denominator, the underreporting rate of average samples was 5.29%; the underreporting rate of death cause surveillance was 20.37%, higher than the rate (15.92%) by using average samples as denominator. Conclusion Any samples of death are incomplete, even three samples were used, the underreporting still exists. Capture recapture method can be used to correct the error caused by underreporting death by death surveillance system, and the number of death can be estimated more accurately.
Key words: Capture re-capture    Mortality    Underreporting rate    

居民死亡率是反映居民健康状况的一项重要指标,是评价卫生工作质量和效果的科学依据,也是研究人口自然变动规律的重要内容。我国于2004年4月建立了以医疗机构报告为基础的死因监测报告系统,但是在不同地区存在有不同程度漏报,人口死亡率与实际水平有一定差距。为了解四川省彭州市全死因死亡漏报情况,本研究收集了多种不同样本来源的死亡记录,采用捕获-再捕获方法估计全死因死亡率,评价死亡漏报情况,同时对其应用效果进行评估。

1 材料与方法 1.1 资料来源

从以下3个途径获取20122013年彭州市常住人口的死亡资料:(1)从死因监测系统中下载得到彭州市医疗机构上报的死亡登记人数10 825人。(2)收集乡镇计划生育办公室(乡镇计生办)两年期间的死亡登记人数11 272人。(3)以村、社区(居委会)为单位,召集乡村干部、村医生等有关人员回忆并整理出死亡名单共计9562人。在上述名单中删除常住地址不为彭州市的死亡记录。各种途径获取的数据资料包含有死者姓名、性别、乡镇、住址、身份证号码、出生日期、死亡日期信息。

1.2 方法 1.2.1 数据匹配

在ACCESS数据库中对收集到的资料进行整理。用住址补充缺失的死者所在乡镇,共计11 047条记录;用身份证号码补充缺失的出生日期,共计9718条记录。不同来源的死亡记录中同一死者存在姓名登记失误的情况(主要为发音相同而字不同),本研究把每条死亡记录的死者姓名转换为姓名拼音后,在不同来源的数据之间按以下规则进行匹配,姓名简拼字母(即姓氏的拼音字母加名的拼音首字母)、性别、出生日期一致,或者姓名、性别、乡镇一致可认定为同一死者。

1.2.2 统计学分析

采用捕获-再捕获方法来估计出以上3种不同途径获得的样本均漏失的死亡人数,再加上样本合并后的死亡人数,即得出该封闭群体中的死亡总数。在SAS 9.1软件的Genmod模块中采用连接函数为对数(log)的线性模型[1, 2],因变量使用Poisson分布。

由于不同样本之间可能不独立,存在交互作用的影响,应建立多个不同结构的对数线性模型。假设N表示观察到的个体总数,每个个体在3次调查中被观察的历史可用3个足标(i,j,k)表示,足标1、2分别表示个体在对应的样本中出现和不出现,mijk表示被观察的历史(i,j,k)个数的期望频数,对数线性模型有如下几种结构:

①三样本相互独立模型

②第三个样本与前两个独立

(这种模型有3个不同的形式)

③两对样本不独立

(这种模型也有3个不同的形式)

④各对样本都不独立

对上述情形有极大似然估计,,其中,模型(4)必须与数据完全符合,用比(4)少一些参数的模型,是希望得到N更有效的估计。模型选择按照最小信息准则(Akaike information criterion,AIC),以AIC值最小的作为最终模型。

2 结果 2.1 匹配结果

按照数据匹配条件共筛选出死亡登记人数12 875人,其中死因报告、乡镇计生办、村委会均出现的人数为7843人(占60.92%),在两个样本中出现的人数为3098人(占24.06%),仅在一个样本中出现的人数为1934人(占15.02%);网报共计10 825人,乡镇计生办登记11 272人,村委会登记9562人,见表 1

表 1 2012-2013年彭州市不同样本来源死亡人数分布 Table. 1 Death distribution of different sample ource in Pengzhou,2012-2013
网报乡镇计生办村委会死亡人数构成比(%)
1007896.13
1101 76713.72
1014263.31
0107575.88
0119057.03
0013883.01
1117 84360.92
合计12 875100.00
2.2 死亡及漏报估计

在对数线性模型结构中A、B、C分别代表网报、乡镇计生办和村委会的独立项,AB、AC和BC为它们的交互项,从7种不同的模型结构中选择出结构为A,B,C,AB,BC最终模型,见表 2。得到彭州市20122013年常住人口死亡人数估计值为13 594人(95%CI:13 537~13 651)。

表 2 不同结构的对数线性模型拟合效果比较 Table. 2 Fitting effect of different structure of log-linear model
模型结构AIC
注:(1)为最终选择的模型结构。
A,B,C1664
A,B,C,AB1483
A,B,C,AC1445
A,B,C,BC1047
A,B,C,AB,AC1160
A,B,C,AB,BC(1)599
A,B,C,AC,BC704

3个样本合并后仍然存在漏失的情况,将捕获-再捕获方法估计的死亡人数作为分母,计算合并样本漏失率为5.29%。将彭州市20122013年常住人口数766 751人作为分母,计算网报登记、合并样本以及捕获-再捕获方法估计20122013年死亡率分别为1.41%、1.68%、1.77%,可见捕获-再捕获方法估计的死亡率高于前两者。将样本合并后的死亡人数直接作为分母,计算死因网报漏报率为15.92%,然而捕获-再捕获方法估计的死亡人数作为分母,计算死因网报漏报率为20.37%,高于前者。

3 讨论

采用捕获-再捕获方法估计彭州市20122013年全死因死亡率为1.78%,高于死因监测系统报告死亡率1.41%。从结果中可见,估计的全死因死亡人数为13 594人,高于网报、乡镇计生办、村委会登记人数。可见,对于任何一个样本,死亡记录都不完整,采用捕获-再捕获方法估计全死因死亡率应更合理,否则会低估实际的死亡水平。

其他文献中评价死因监测漏报的一般方法是将多种渠道收集的样本合并后作为所有的死亡记录,再计算死因漏报率[3, 4],但是即使3个样本合并后仍然存在漏失的情况,本研究中样本合并后全死因死亡人数为12 875人,估计合并样本漏失率为5.29%,因此用一般方法评价死因监测漏报与捕获-再捕获方法相比在结果上有所区别。若按一般方法将样本合并后的死亡人数直接作为分母,计算死因网报漏报率为15.92%,其他文献报道城市远郊地区为14.69%[4],二者差距不大,但是采用捕获-再捕获方法估计死因网报漏报率为20.37%,高于一般方法结果。

捕获-再捕获方法最初应用在生态学领域进行种群数量估计[5],该方法对样本有严格的条件限制[1, 6]。首先,研究的群体为封闭的群体,即没有发生变化的群体;其次,不同样本个体之间能相互匹配;最后,不同样本之间均相互独立,在每个样本来源中,个体均有同等的机会被捕获。针对上述条件限制,本研究中将研究的群体限定为20122013年彭州市常住人口中全死因死者,剔除常住地址不符合的死亡记录;在数据收集阶段发现,同一死者在不同样本中存在姓名登记失误的情况,通常由于死者家属采用口述方式,另一人在记录死者姓名过程中容易误写为其他发音相似的汉字,无论是医院医生在死因登记过程中还是村委会在摸底调查中,都可能出现这种情况,因此将姓名汉字转换为简拼形式能更有效匹配。最后一点在流行病学中实现有较大的难度,特别是要求样本之间相互独立,原因是众多因素的影响对人类的几次捕获通常不是随机的。本研究采用对数线性模型,通过交互项来反映样本之间相依性[1, 7],相对于两样本的捕获-再捕获方法拟合效果更好。从选择的模型结构中可以看出加入乡镇计生办来源的样本与其余两个样本之间相依后的模型更优于其余几个模型,根据参数估计结果,二者相依性均为正,若不使用交互项则会低估了漏失。

在疾病监测中普遍存在漏报的现象,本研究利用网报、乡镇计生办、村委会登记资料,在校正漏报的同时估计出全死因死亡总数,该方法原理不复杂且成本低廉,很容易应用于监测报告完整性评价,也是对目前传统疾病监测方法的重要补充。

参考文献
[1] Fienberg SE. The multiple recapture census for closed Populations and incomplete 2k contingency tables[J]. Biometrika,1972,59(3):591-603.
[2] Hook EB, Regal RR. Capture-recapture methods in epidemiology: methods and limitations[J]. Epidemiol Rev,1995,17(2):243-264.
[3] Pan JJ, Zhang L, Zhang QJ, et al. Under-reporting of death in disease surveillance system in Hubei,2009-2011[J]. Disease Surveillance,2013,28(6):478-480. (in Chinese) 潘敬菊,张岚,张庆军,等. 2009-2011年湖北省疾病监测点死因漏报调查分析[J]. 疾病监测,2013,28(6):478-480.
[4] Yang NN, Yan YQ, Sun HL, et al. An evaluation on the Under-reporting and quality of death surveillance system among Wuhan residents[J]. Chinese Journal of Prevention and Control of Chronic Diseases,2011,19(6):613-616. (in Chinese) 杨念念,严亚琼,孙惠玲,等. 武汉市居民死亡漏报调查及死因监测质量评价[J]. 中国慢性病预防与控制,2011,19(6):613-616.
[5] Capture-Recapture History[EB/OL]. [2015-01-29].http://www.pitt.edu/-yuc2/cr/history.htm.
[6] Fang JQ, Lu Y. Advanced medical statistics[M]. Beijing: People's Medical Publishing House,2002. (in Chinese) 方积乾,陆盈. 现代医学统计[M]. 北京: 人民卫生出版社,2002.
[7] Sanathanan L. Models and estimation methods in visual scanning experiments[J]. Technometrics,1972,14(4):813-829.