疾病监测, 2014, 29(5): 399-402
DOI: 10.3784/j.issn.1003-9961.2014.05.016
Applicability of WSARE 3.0 algorithms in early warning of mumps outbreak in Shenzhen
ZHENG Qing-ming1, LI Yuan2, WANG Tie-qiang1, KONG Dong-feng2, LYU Qiu-ying2
1. Guangming New District Center for Disease Control and Prevention, Shenzhen, Shenzhen 518106, Guangdong, China;
2. Shenzhen Center for Disease Control and Prevention, Shenzhen 518000, Guangdong, China
Abstract
Objective To evaluate the application of WSARE 3.0 algorithms in the early detection of communicable disease outbreaks in Shenzhen. Guangdong province. Methods The real-time surveillance and early warning of the incidence of mumps in Shenzhen in 2013 was conducted by using WSARE 3.0 algorithms based on Bayesian Network. Results WSARE 3.0 algorithm generated 28 abnormal signals of mumps cases with statistical significance in Shenzhen in 2013. including 2 tri-component abnormal signals and 16 double-component abnormal signals. The peak of early warning was during April-July. Three severe mumps outbreaks were detected in communities, in which 2 were reported as public health emergency. Fourteen signals were generated for the abnormal increase of mumps cases in a community. Conclusion WSARE 3.0 algorithms could timely detect abnormal change of mumps cases in some specific groups in some local areas and can be used in early warning of communicable diseases in Shenzhen.
Keywords:    WSARE algorithm   Mumps   Early warning  

WSARE 3.0算法在深圳市流行性腮腺炎暴发早期预警中的应用
郑庆鸣1, 李媛2, 王铁强1, 孔东风2, 吕秋莹2
1. 深圳市光明新区疾病预防控制中心, 广东 深圳 518106;
2. 深圳市疾病预防控制中心, 广东 深圳 518000
收稿日期:2014-3-3
基金项目:深圳市科技计划项目(No.201203379)
作者简介:郑庆鸣,女,吉林省汪清县人,主管医师,硕士,主要从事传染病预防控制工作; 李媛,女,广东省韶关市人,主管医师,硕士,主要从事传染病预防控制工作
通讯作者:郑庆鸣,Tel:0755-81733477,Email:281136727@qq.com
摘要
目的 探讨WSARE 3.0算法应用于深圳市传染病早期预警的适用性。 方法 采用基于贝叶斯网络基线的 WSARE 3.0算法对2013年深圳市流行性腮腺炎模拟实时监测预警。 结果 WSARE软件探测到2013年深圳市街道层面有统计意义的流行性腮腺炎预警信号28次,其中3个特征变量联合异常变化的信号2次,2个特征变量联合异常变化的信号16次,预警高峰期为4-7月。发现了3次明显的聚集疫情,其中2起疫情被报告突发公共卫生事件,并对某一街道短期内病例数异常增高的现象持续发出14次预警信号。 结论 WSARE 3.0算法能较精确地探测到局部区域特定属性人群中的流行性腮腺炎疫情异常变化,在深圳市传染病的早期预警中具有一定的应用价值。
关键词:    WSARE算法   流行性腮腺炎   早期预警  

内容大纲
1 材料与方法
1.1 研究设计
1.2 数据来源及预处理
1.3 预警实施及参数设置
2 结果
2.1 2013年深圳市流行性腮腺炎发病概况
2.2 预警系统的流行性腮腺炎预警信号概况
2.3 WSARE 3.0探测结果
3 讨论

传染病预警是预测技术在实践中的重要应用,可及时提醒相关人员做必要的数据分析,并在不能排除是否为疑似传染病暴发的情况下,尽早开展现场调查以确认是否为传染病的暴发,为传染病突发事件的干预赢得宝贵的时间[1]。我国“传染病预警信息系统”(预警系统)采用单病例预警法、累积和控制图法、移动百分位数法和空间热点探测方法,以病例的报告时间及“现住址”进行预警判断[2]。传染病的预警模型较多,可分为时间预警模型、空间预警模型及时空预警模型,不同模型有不同的适用范围。随着传染病数据日益丰富,可根据实际情况选择更恰当的模型运用于预警研究[3]。本研究运用基于贝叶斯网络基线的时空预警模型WSARE 3.0算法分析深圳市2009 2013年的流行性腮腺炎病例数据,对2013年数据逐日模拟实时预警分析,探测可能存在的爆发性疫情,探讨WSARE算法应用于深圳市传染病早期预警的适用性。

1 材料与方法
1.1 研究设计

研究分为四个阶段。第一阶段,利用WSARE软件,在街道层面对2013年深圳市流行性腮腺炎的发病情况逐日模拟实时预警分析,产生有统计学意义的预警信号A。第二阶段,通过报告卡编号反查信号A当日实际病例的现住地址编码、性别、职业和年龄等信息,如在街道范围出现明显的病例聚集,为有现实意义的预警信号,其他则为虚假信号。第三阶段,从预警系统中获得2013年深圳市流行性腮腺炎的预警结果B。将A、B与2013年报告的流行性腮腺炎突发公共卫生事件相对比,评价WSARE 3.0算法发现聚集性病例的能力。第四阶段,讨论WSARE应用于深圳市传染病早期预警的适用性。

1.2 数据来源及预处理

截取中国疾病预防控制中心(CDC)传染病报告信息管理系统中2009年1月1日至2013年12月31日报告的深圳市流行性腮腺炎病例共31 016例,经清理及逻辑查错,剔除重复卡、已删除卡及现住地址不详的数据后,共计病例31 010例,2009 2013年报告的病例数分别为3033、3865、9748、9001和5363例。提取的数据变量为卡片编号、性别、职业、现住地址编码和卡片录入时间。其中,以“卡片录入时间”作为时间变量,并得到相应的星期数及季节;以“现住址编码”所对应的共57个街道办/办事处为空间变量纳入分析;将患者按年龄分为<1岁、1~5岁、6~11岁、12~17岁、≥18岁5个年龄段纳入分析;患者职业分为幼托儿童、散居儿童、学生、工人、家务及待业、教师、商业服务、医务人员、其他。对整理后的数据转换为WSARE预警分析所需的.csv数据格式进行储存。以上所有步骤均通过Excel统计软件完成。

1.3 预警实施及参数设置

本研究采用贝叶斯网络基线的WSARE 3.0算法,对2009 2013年深圳市流行性腮腺炎数据进行分析。以2009 2012年流行性腮腺炎数据作为基线数据,对2013年数据模拟逐日实时预警分析。构建基线时,纳入季节效应和周末效应作为环境变量。WSARE 3.0的参数设置见表1。

表1 WSARE 3.0算法的参数设置
Table 1  Parameters of WSARE 3.0 algorithms

  参数  含义  参数值
env_attnames环境属性变量名season day_of_week
num_bayesnet_rows由贝叶斯网络产生的基线样本量10 000
season_attname在原始数据中增加季节变量season
day_of_week_attname在原始数据中增加星期数变量day_of_week
max_components规则的最大成分数目3
start_date预警开始日期2013-01-01
end_date结束日期2013-12-31
scoretype得分算法FISHEREXACT_SCORETYPE
2 结果
2.1 2013年深圳市流行性腮腺炎发病概况

按卡片录入日期统计,深圳市2013年共报告流行性腮腺炎病例5363例,全年均有发病,并呈明显的季节性分布,高发月份为4 7月,占全年报告数的47.4%。全市2013年流行性腮腺炎发病率为50.8/10万,其中发病率最高的3个区为光明新区(140.5/10万)、大鹏新区(81.7/10万)和龙岗区(71.4/10万),发病率最低的3个区为南山区(28.1/10万)、龙华新区(36.4/10万)和宝安区(37.6/10万)。2013年全市报告2起流行性腮腺炎突发公共卫生事件,光明新区和大鹏新区各1起。

2.2 预警系统的流行性腮腺炎预警信号概况

深圳市2013年预警系统中时间聚集性探测预警模型(时间模型)发出流行性腮腺炎预警信号114条,时间-空间聚集性探测预警模型(时空模型)发出预警信号66条,全部被疫情管理人员判定为“排除疑似事件”。反查2013年报告的2起流行性腮腺炎突发公共卫生事件,在疫情发生期间,预警系统均未对疫点所在辖区发出预警信号。

2.3 WSARE 3.0探测结果

WSARE软件探测到2013年深圳市57个街道办(办事处)出现有统计意义的流行性腮腺炎预警信号(P<0.05)28次,其中1月4次,4月4次,5月8次,6月6次,7月4次,8月2次,见表2。其中发现三个特征变量联合异常变化的信号2次,两个特征变量联合异常变化的信号16次,单个特征变量异常变化的信号10次。

表2 2013年WSARE 3.0算法流行性腮腺炎实时探测结果
Table 2  Result of real-time detection of mumps by WSARE 3.0 algorithms

序号日期(年-月-日)特征1 值1特征2 值2特征3值3P
12013-01-04地区盐田街道办职业幼托儿童0.00
22013-01-05地区盐田街道办0.00
32013-01-08地区南湾街道办职业学生0.03
42013-01-09地区盐田街道办职业幼托儿童0.00
52013-04-05地区莲塘街道办职业幼托儿童0.00
62013-04-10年龄组≥18岁地区松岗街道办0.03
72013-04-23地区公明街道办0.03
82013-04-26地区观澜街道办0.04
92013-05-06年龄组6~11岁地区公明街道办0.00
102013-05-08地区公明街道办职业学生0.01
112013-05-13地区公明街道办0.00
122013-05-14地区葵冲街道办职业学生0.00
132013-05-22地区公明街道办0.00
142013-05-27地区公明街道办0.00
152013-05-28年龄组6~11岁地区公明街道办职业幼托儿童0.00
162013-05-30地区葵冲街道办职业学生0.00
172013-06-04地区公明街道办职业幼托儿童0.00
182013-06-17地区公明街道办0.00
192013-06-18地区公明街道办职业幼托儿童0.00
202013-06-19年龄组6~11岁地区公明街道办0.04
212013-06-20地区公明街道办职业幼托儿童0.02
222013-06-24性别女性地区公明街道办0.03
232013-07-01年龄组12~17岁地区园岭街道办0.01
242013-07-11地区公明街道办0.01
252013-07-15地区公明街道办0.00
262013-07-29性别男性地区福永街道办职业散居儿童0.00
272013-08-08地区公明街道办0.02
282013-08-15职业工人0.03

通过病例编号,反查有意义信号的当天原始数据信息,发现2013年深圳市在街道层面共有3次明显的流行性腮腺炎病例聚集。(1)2013年1月4、5和9日,探测到盐田街道办的流行性腮腺炎有聚集,其中1月4日和9日的信号提示病例的职业为“幼托儿童”。 反查病例信 息发现,1月4日该街道办报告病例5例,职业为幼托儿童的4例,其中3例为LQ幼儿园学生。1月5日盐田街道办报告病例5例,其中托幼儿童3例,均为LQ幼儿园的学生。1月9日盐田街道办报告病例4例,职业为幼托儿童的3例,其中2例为LQ幼儿园的学生。(2)5月6、8、13、22、27、30日,6月4、17 20、24日,7月11日和15日共对公明街道办发出14次预警信号,其中7次信号提示病例的职业为“幼托儿童”或年龄为“6~11岁”。反查病例信息发现,5 7月公明街道办出现流行性腮腺炎发病高峰,3个月报告病例数占全年病例的46.5%(321/691),并报告了一起幼儿园的突发公共卫生事件。(3)5月14日,探测到葵冲街道办的流行性腮腺炎有聚集,反查病例信息发现,当日报告8例,全部是为KCH中心小学学生,同期报告了该学校的突发公共卫生事件。

余下的预警信号,通过反查信号当天原始病例信息,病例皆呈散发,并未出现异常的病例聚集。7月29日,WSARE 3.0发出三特征变量联合异常变化的信号,但病例实际散发,为虚假信号。

3 讨论

我国于2005年启动“重点传染病监测自动预警信息系统建设与应用试点项目”,该项目基于时间模型(移动百分位数法),建立起传染病预警信息系统。2007年在时间模型基础上,进一步开展传染病时空模型研究,于2008年在全国20个省份开展了时空模型试点工作[4]。深圳市于2008年加入该项目,开展以时间序列预测方法为基础的空间探测模型,为深圳市早期预警工作的开展提供了一定的依据。但在实际运行过程中,该预警系统暴露出部分参数设置与该市实际情况不相符、灵敏度过高、预警阳性率较低、无法真正实现传染病早期自动预警等缺点。如2013年深圳市共收到时间模型和时空模型预警信号2106条,被判为疑似事件的仅有16条,预警信号阳性率仅0.76%。其中时空探测模型关于地域的设定也未能符合深圳市的实际情况。如深圳市宝安区,共有6街道,每个街道地域范围广,人口众多,平均每个街道40余万人,如病例均属于同一街道,系统就会将这些病例判为有聚集性,发送预警信号,但经核实后,大部分病例并无任何空间联系。所以针对深圳市的传染病自动预警阳性率过低,辖区设置面积较大的实际情况,需要探索一种能探测多种特征变量组合进而寻找异常值的更具高时效性和精准性的传染病早期预警方法。

时间-空间预警模型WSARE是一种可用于传染病暴发早期探测的多因素方法,能够提高探测的时效性和准确性。WSARE有采用基于历史数据的WSARE 2.0和基于贝叶斯网络基线的WSARE 3.0方法,其中WSARE 3.0算法是以长期的历史数据构造贝叶斯网络,并纳入环境属性,考虑了季节等时间趋势因素,对于长期监测预警,如法定传染病、慢性疾病监测等,采用该算法具有明显优势[5]。预警系统中,流行性腮腺炎采用移动百分位数法和空间热点探测方法预警。深圳市2013年预警系统共发出流行性腮腺炎预警信号180条,全部为虚假信号,且当年报告的流行性腮腺炎突发公共卫生事件全部未被预警。而WSARE 3.0探测到有统计意义的信号28次,在街道层面发现了3次明显的流行性腮腺炎病例聚集,2起突发公共卫生事件均被预警,并对公明街道办短期内病例数异常增高的现象持续发出预警信号。与现行预警系统的探测结果相比,WSARE 3.0的探测结果更有现实意义,能进行较精确的空间和人群特征定位,探测到现行预警系统不能探测到的信号,并排除现行预警系统发出的大量虚假信号。在我国已有WSARE算法应用于麻疹、猩红热、细菌性痢疾等疾病的早期预警研究的文献报道[5-6],结果表明,以中国CDC传染病报告信息管理信息系统中的病例长期监测数据为基础,该方法能及时有效地探测到局部区域特定属性人群中传染病发病的异常增高,识别数据中不同特征变量组合构成的异常组群。

在使用WSARE 3.0算法时应注意以下问题:(1)贝叶斯网络构建基线需要大量的数据,环境变量越多,贝叶斯网络结构越复杂,所需的基线时间也越长[5]。因此手足口病等纳入监测系统时间较短的病种及大型会议、体育活动、博览会等短期监测预警尚不适合用此方法。(2)应将数学模型预警与现场调查、实验室检测相结合[6]。如流行性腮腺炎的诊断多以临床诊断为主,且部分轻症病例未被发现和报告,传染病报告信息管理系统中的监测信息无免疫史等,都将对预警的精确度造成影响。(3)该方法只能用于分类变量数据,对于计量变量数据可以在数据预处理时将其转换为分类数据进行探测分析,但是这样会损失一部分数据信息,特别是分类的截断值的选取对结果有较大影响[5]。本研究将患者的年龄转换为分类数据,年龄段的截断值可能对预警精准度造成影响。如5月28日探测到公明街道办的流行性腮腺炎有聚集,职业为“幼托儿童”,年龄为“6~11岁”,就能说明这一点。通过本研究,我们认为WSARE适用于深圳市的传染病早期预警,对于历史基线较长的病种(如流行性腮腺炎、感染性腹泻等),基于贝叶斯网络基线的WSARE 3.0能够更精确的探测到聚集,探测结果优于现行预警系统使用的时间序列和时空序列方法的探测结果。

参考文献
[1] Lin ZL.Study on the effect evaluation and influence of infectious diseases early warning in Haikou [D]. Tianjin: Tianjin University,2010.(in Chinese) 林忠岭. 海口市传染病预警效果评价及其影响因素研究[D].天津:天津大学,2010.
[2] The Chinese center for disease control and prevention.The information about adjusting the threshold value of the automatic early warning information system model(Time series model)of infectious disease[S]. Beijing: The Chinese Center for Disease Control and Prevention,2010.(in Chinese)中国疾病预防控制中心.中国疾病预防控制中心关于调整全国传染病自动预警系统(时间模型)预警阈值等事宜的通知[S].北京:中国疾病预防控制中心,2010.
[3] Wang XL, Wang QY, Luan RS, et al.The early warning model of infectious disease[J].Modern Preventive Medicine,2008,35(22):4339-4341.(in Chinese)王小莉,王全意,栾荣生,等. 传染病疫情早期预警的主要模型[J]. 现代预防医学,2008,35(22):4339-4331.
[4] Qin LP. The study on influence factors of the automatic early warning information system of infectious disease [D]. Beijing:The Chinese Center for Disease Control and Prevention,2008.(in Chinese)秦利平.传染病自动预警信息系统预警效果的影响因素研究[D].北京:中国疾病预防控制中心,2008.
[5] Zhang ZW, Feng ZJ, Li XS. A study regarding the applicability of WSARE algorithms in the early warning system of infectious disease outbreaks[J].Chinese Journal of Epidemiology,2010,31(11):1306-1310.(in Chinese)张子武,冯子健,李晓松. WSARE计算方法在传染病暴发早期预警中的应用[J].中华流行病学杂志,2010, 31(11):1306-1310.
[6] Zhang DT, Zhang Y, Yang P, et al. The application of WASARE algorithm in early detection of the scarlet fever outbreak[J].China Preventive Medicine,2012,13(1):26-29.(in Chinese)张代涛,张奕,杨鹏,等. WSARE计算方法在猩红热暴发预警中的应用[J].中国预防医学杂志,2012,13(1):26-29.