疾病监测  2016, Vol. 31 Issue (2): 96-100

扩展功能

文章信息

李越, 陈涛, 杨静, 汪立杰, 祝菲, 王大燕, 舒跃龙
LI Yue, CHEN Tao, YANG Jing, WANG Li-jie, ZHU Fei, WANG Da-yan, SHU Yue-long
2009年后我国北方地区流感样病例的动态预警分析
Dynamic surveillance for influenza like illness in northern China after pandemic of influenza A (H1N1) in 2009
疾病监测, 2016, 31(2): 96-100
Disease Surveillance, 2016, 31(2): 96-100
10.3784/j.issn.1003-9961.2016.02.004

文章历史

收稿日期: 2015-11-18
2009年后我国北方地区流感样病例的动态预警分析
李越, 陈涛, 杨静, 汪立杰, 祝菲, 王大燕, 舒跃龙     
中国疾病预防控制中心病毒病预防控制所, 国家流感中心卫生部医学病毒和病毒病重点实验室, 北京 102206
摘要: 目的 探索2009年流感大流行后我国北方地区流感样病例(influenza like illness,ILI)预测预警模式,并评价预测预警效果。方法 根据2010-2014年我国北方地区ILI哨点监测数据,利用Eviews 6.0软件建立乘积季节ARIMA模型,选择最适宜的时间间隔对2015年1-32周ILI占门急诊病例百分比(ILI%)进行预测。采用流行控制图法探索北方地区ILI预警模型,通过比较灵敏度、特异度和绘制ROC曲线,选择合适的预警界值,结合乘积季节ARIMA模型的预测值,进行预警并评价预警效果。结果 建立了乘积季节ARIMA模型(1,0,0)×(1,1,0)52,模型拟合度 R2=0.65,不同时间间隔预测结果中,2周时间间隔预测效果较好,且能兼顾预测时效性,模型均方根误差为0.37,平均绝对误差为0.24,平均相对误差百分比为8.26%。ILI%预警界值选用P95预警功效较好,灵敏度为100%,特异度为96%。结合ARIMA模型2周时间间隔预测结果对2015年1-32周北方地区ILI进行预测预警,结果与实报预警一致率为100%。结论 利用ARIMA模型和流行控制图结合构建的动态预警模型,能够较好反映我国北方地区ILI流行趋势,为早期发现和控制流感暴发和流行提供依据。
关键词: 流感    ARIMA模型    控制图法    预警    
Dynamic surveillance for influenza like illness in northern China after pandemic of influenza A (H1N1) in 2009
LI Yue, CHEN Tao, YANG Jing, WANG Li-jie, ZHU Fei, WANG Da-yan, SHU Yue-long     
National influenza Center, Key Laboratory for Medical Virus and Viral Diseases of the Ministry of Health, Chinese Center for Disease Control and Prevention, Beijing 102206, China
Corresponding author: SHU Yue-long, Email: yshu@cnic.org.cn
Abstract: Objective To discuss the dynamic warning model for influenza like illness (ILI) in northern China after the pandemic of influenza A (H1N1) in 2009. Methods By using software Eviews 6.0, seasonal autoregressive integrated moving average (ARIMA) model was established based on ILI sentinel surveillance data in northern China during 2010-2014, then the optimum time-internal for prediction was selected. Control chart was used to establish a warning model for ILI in northern China. After calculating sensitivity, specificity and describing receiver-operating characteristic curve (ROC), the optimal alert threshold was selected. The dynamic warning can be achieved by combining these two models. Results We established the multiple seasonal ARIMA (1, 0, 0)×(1, 1, 0)52, the R2 value of the model fitting degree was 0.65. Among these different time-interval patterns, we found 2-week internal had a balance between the effectiveness and the timeliness, the root mean square prediction error was 0.37, the mean absolute error was 0.24, and the mean relative error percentage was 8.26%. Selecting P95 as the alert threshold line, the sensitivity was 100% and the specificity was 96%. By using 2-week time-interval pattern to alert ILI% of 1-32 week in northern China in 2015, the predicting result was consistent with actual data. Conclusion We established an early warning model by combining the ARIMA model with control chart, which would reflected the epidemiological trend of ILI cases in northern China and support the early detection and control of influenza outbreak.
Key words: Influenza    ARIMA model    Control chart    Early warning    

流行性感冒(流感)是一种传染性极强的疾病,历史上一共发生过4次大流行,均给人类健康和社会经济造成了巨大的损失[1, 2]。监测预警是预防、控制流感暴发和流行的主要手段,通过建立早期预警模型,可以使流感防控工作更具针对性、预见性和主动性。2003年以来我国的流感监测系统得到快速发展[3],更好地利用监测数据实现早期预警,具有重要的现实意义。2009年流感大流行之后,流感流行趋势随之改变,然而目前我国对于大流行之后流感活动预警方面研究并不充分。ARIMA模型和控制图法分别是传染病预测预警中常见的定量和定性预测模型[4]。本研究将ARIMA模型与控制图法进行有效结合,基于20102015年我国北方地区流感哨点监测数据,探索大流行后北方地区流感样病例预警模式,实现动态预警并评价预测预警效果,为流感的防控工作提供技术支持。

1 材料与方法 1.1 资料来源

以2010年第1周至2015年第32周中国北方地区报告的流感样病例(ILI)占门急诊病例百分比(ILI%)为原始数据。数据来源于“中国流感监测信息系统”。

1.2 方法 1.2.1 建立预警模型

根据流行控制图预警模型原理[5],以2010-2013年4年同周次(如第5周)的ILI%,将时间向前向后各移动一个单位[6, 7],以这些周次的数据(第4~6周)为基线数据(移动窗口大小为“4×3”=12),计算指定的百分位数(P50、P60、P70、P80、P90、P95),作为候选的预警界值,建立预警模型。

1.2.2 确定流行标准

经典的“流行”定义指某种疾病的发病水平超过历年一般水平,根据杨维中等[7]的研究结果,以大于历年(本研究为20102013年)周病例数的“x+2s”作为判断疾病流行的标准,将2014年每周实际发生的ILI%与该流行标准进行比较,大于该标准则判断为流行,同时发出预警信号,否则判断为散发,不发出预警信号,该结果作为判断是否需要预警的金标准。

1.2.3 选择合适的预警值

将2014年每周实际发生的ILI%分别与6个候选预警界值进行比较,超过预警界值则进行预警;将各候选模型的预警结果与根据流行标准(x+2s)判断的预警结果进行比较,以此计算各候选值模型的灵敏度、特异度、阳性预测值、阴性预测值,并绘制ROC曲线(receiver-operating characteristic curve),参考曲线上最左上角的点,选出合适的预警界值。

1.2.4 拟合ARIMA模型

根据2010-2014年每周ILI%数据,按照ARIMA模型的建模步骤进行[8, 9, 10, 11, 12]:首先绘制时间序列图,通过数据的平稳化处理、模型识别定阶、参数估计和检验、模型诊断,选出最优模型。按照不同时间间隔对2015年132周数据进行迭代预测,时间间隔分别为单周、2周、4周、16周、32周,通过与实际ILI%进行比较,选择最佳预测时间间隔。

1.2.5 评价预测预警效果

将最佳时间间隔的预测值与预警界值比较,如果预测值超出预警界值则发出报警;然后以该周实际发生的ILI%和预警界值比较判断是否报警,比较预测报警与实际报警的一致率,评价预测预警效果。

2 结果 2.1 ARIMA模型拟合以及预测时间间隔选择 2.1.1 序列的平稳化

绘制2010-2014年中国北方地区哨点监测ILI%时间序列图(图 1)。可以看出该序列波动性较大,具有明显的季节性周期,冬春季节达到发病高峰,序列不平稳。对原序列进行自然对数转化以平稳序列的方差,并且对序列进行步长为52一阶季节差分。为避免序列过度差分造成有效信息的丢失,序列的季节差分后,即进行序列的平稳性检验。依据ADF单位根检验结果显示,检验的T统计量为-4.629 471(P <0.01),说明序列平稳性良好,可以对季节差分后的序列进行建模。

图 1 2010-2014年我国北方地区ILI%时间序列 Figure 1 Time series of ILI% in north China, 2010-2014
2.1.2 模型识别定阶

由于在序列平稳化阶段进行了周期为52的一阶季节差分,故选择 D=1,d=0的乘积季节ARIMA(p,d,q)×(P,D,Q)52模型。绘制ACF和PACF图(图 2),由图 2可以看出,ACF拖尾,PACF 1阶截尾,提示选择AR模型,则P=1,q=0。相关研究提示:P和Q超过高阶的情况很少[13],所以本研究选择对P和Q分别取0和1,逐个进行试验,最后通过模型参数检验,比较赤池信息准则AIC值和拟合优度R2值,选定ARIMA(1,0,0)×(1,1,0)52为最优模型,模型的拟合度R2=0.65,模型AIC值最小为-2.03,模型参数估计和参数检验结果如表 1

图 2 季节差分后序列的ACF和PACF函数图 Figure 2 ACF and PACF after seasonal difference
表 1 ARIMA(1,0,0)×(1,1,0)52模型参数估计和检验结果 Table 1 Parameter estimation and test result of ARIMA (1,0,0)×(1,1,0)52 model
参数 系数 标准差 t P
AR(1) 0.681 29 0.057 37 11.875 47 0.000 0
SAR(52) -0.457 93 0.066 892 -6.845 693 0.000 0
注:AR(1): P=1时的模型参数;SAR(52): P=1时的模型参数。
2.1.3 模型检验

对ARIMA(1,0,0)×(1,1,0)52模型的残差序列进行Q检验,结果如图 3Q统计量P>0.05,序列为白噪声序列,不存在相关性,序列信息提取充分,模型构建成功。

图 3 残差序列ACF和PACF函数图 Figure 3 ACF and PACF figure of the residual error sequence
2.1.4 模型预测

用ARIMA(1,0,0)×(1,1,0)52模型,通过不断迭代法,按照单周、2周、4周、16周、32周等不同时间长度,对2015年132周的数据进行预测,并用实际发生值评价预测效果,不同预测时间长度的均方根误差、平均绝对值误差以及平均相对误差百分比见表 2。其中单周预测的预测精度最高,随着预测时间的延长,预测的准确度逐渐下降,通过迭代计算的方式,不断为模型加入新数据,起到了模型校正效果,提高了预测的准确性。

表 2 ARIMA模型不同时间长度预测效果 Table 2 Prediction effect of model with different time-intervals
指标 单周预测 2周预测 4周预测 16周预测 32周预测
均方根误差 0.34 0.37 0.41 0.45 0.47
平均绝对误差 0.21 0.24 0.31 0.32 0.35
平均相对误差(%) 7.08 8.26 10.49 10.99 12.18
2.2 预警界值选择

根据杨维中等[7]定义“流行”的方法,2014年有两周超出了流行线,应该发出预警信号。各候选界值均能正确进行预警,敏感度达到100%,特异度随着预警界值的提高而逐步提高,各候选预警界值的灵敏度、特异度、阳性预测值、阴性预测值如表 3;各候选预警界值ROC曲线如图 4,最终选定流感样病例的预警界值为第95百分位数,此时灵敏度为100%,特异度为96%。

表 3 各候选预警界值的预警效果 Table 3 Warning effect of different alert thresholds
指标 敏感度(%) 特异度(%) 阳性预测值(%) 阴性预测值(%)
P 50 100 68 11 100
P 60 100 80 17 100
P 70 100 86 22 100
P 80 100 90 29 100
P 90 100 94 40 100
P 95 100 96 50 100
图 4 ILI预警的ROC曲线(控制图法) Figure 4 ROC curve of ILI early warning
2.3 动态预测预警模型评价

根据ARIMA模型不同时间长度的预测效果,同时兼顾预警时效性,最终选定2周动态预测模型。将2015年132周的2周预测预警结果与2015年实际预警结果进行比较,结果见表 4图 5。利用季节乘积ARIMA模型结合控制图法构建的动态预警模型,其动态预警结果与实报预警一致率为100%。

表 4 2015年132周北方地区ARIMA-流行控制图模型动态预测预警效果 Table 4 Dynamic warning effect of ARIMA-control chart model in northern China, 1st-32nd week, 2015
2015年周次 ILI%P 95预警线 ILI%实报值 ARIMA模型2周预测值 动态预警符合情况
1 4.84 4.11 4.71 1
2 4.86 3.47 4.29 1
3 4.80 3.57 3.64 1
4 4.71 3.08 3.50 1
5 4.51 3.00 3.56 1
6 4.59 2.89 3.41 1
7 4.59 2.72 2.87 1
8 4.25 3.77 2.46 1
9 3.33 2.87 3.33 1
10 3.33 2.57 3.06 1
11 3.30 2.54 2.71 1
12 3.30 2.61 2.66 1
13 3.22 2.56 2.65 1
14 3.17 2.61 2.74 1
15 3.13 2.46 2.60 1
16 3.04 2.33 2.72 1
17 3.16 2.37 2.39 1
18 3.12 2.42 2.70 1
19 3.12 2.31 2.34 1
20 2.92 2.35 2.43 1
21 2.94 2.32 2.39 1
22 2.94 2.31 2.48 1
23 3.09 2.48 2.39 1
24 3.08 2.54 2.51 1
25 3.12 2.56 2.42 1
26 2.98 2.57 2.59 1
27 2.93 2.47 2.59 1
28 2.82 2.54 2.51 1
29 2.78 2.55 2.51 1
30 2.78 2.43 2.54 1
31 2.76 2.43 2.39 1
32 2.73 2.54 2.37 1
注:1代表符合,0代表不符合。
图 5 2015年132周北方地区ARIMA-流行控制图模型动态预测预警效果 Figure 5 Dynamic warning effect of ARIMA-control chart model in northern China, 1st-32nd week, 2015
3 讨论

早期发现疾病暴发或者流行是公共卫生部门应对疫情的重要前提。近年来,随着国家流感监测系统的建立和完善,流感监测网络逐步稳定,收集到大量可靠的监测数据,对这些监测数据有效分析是早期发现和控制流感疫情的重要手段。2009年甲型H1N1流感大流行之后,我国流感流行模式也随之发生改变,大流行之后新的流感预警模式有待探索。流行控制图作为一种经典的“预警”方法,在具有季节性流行或者周期流行规律的传染病中具有广泛应用[14]。既往流感的预警大多是利用该方法,通过事先设定预警界值与当前流感ILI%或者ILI病例数进行对比,以提出预警。这种预警方法为早期发现流感暴发或者流行提供了有效手段,但是单纯使用该方法存在一定的滞后性。本研究通过将季节乘积ARIMA预测模型与流行控制图结合的方式,实现对我国北方地区ILI%的双周动态预测预警,提高了预警的时效性,预测预警与实际预警的一致率为100%,为早期发现疫情提供了可能,为疫情的准备工作争取了时间。另外,本研究选择第95百分位数作为ILI的预警界值,与之前一些流感预警的研究结果一致[6, 15],但是与国家推荐流感预警界值存在一定差异[16],在国家推荐流感预警界值研究中研究人员为了提高预警的灵敏度,预警阈值选择过于保守,存在较多假阳性预警信号。本研究通过对各候选预警界值的灵敏度、特异度、阳性预测值以及阴性预测值进行综合比较,并且通过ROC曲线的绘制,最终确定P95为我国北方地区ILI%的预警阈值,灵敏度为100%,特异度为96%,预警的特异度大大提高。研究表明ARIMA(1,0,0)×(1,1,0)52模型,单周迭代计算的预测精度最高,但是在实际生活中单周预测可能不能满足疾病控制工作时效性的要求。因此本研究对模型不同时间长度的预测效果进行了评价,通过比较认为模型的2周预测效果较佳,同时能够兼顾预警的时效性需求,可以用于今后对北方地区ILI的预警工作中。

尽管如此,本研究依然存在一些局限性。第一ARIMA模型是一种短期预测模型,长期预测误差会越来越大,需要随时对模型进行校正,因此针对ILI的长期预测模型有待于开发。第二,本研究从ILI入手,意图达到对流感暴发或流行进行预警的目的,虽然取得了较好的预警效果,一定程度上为流感的防控工作提供了参考,但是ILI的影响因素复杂,除了与流感病毒流行有关外,还与气温、相对湿度等有着密切的联系;因此在实际疫情防控中,需要结合实验室变异株和耐药株等的综合分析,提出预警和应对措施。第三,流行控制图法一般是利用发病前几年的数据来划定预警线,在实际工作中,适宜的预警界值需要定期进行调整。此外,控制图法进行流感预警的关键在于确定“流行”标准,但是目前国际上尚未制定统一的标准[17, 18]。本文采用杨维中等[7]提出的大于 “x+2s” 作为流行标准,但流行标准定义过高或者过低将对后续流行界值的选择造成偏差,因此在以后的预警研究中仍需对流行标准以及预警界值选择的适宜性进行深入综合的分析和评价。

参考文献
[1] Molbak K, Widgren K, Jensen KS, et al. Burden of illness of the 2009 pandemic of influenza A (H1N1) in Denmark[J]. Vaccine,2011,29 Suppl 2:B63-B69.
[2] Oxford JS. Influenza a pandemics of the 20th century with special reference to 1918:virology, pathology and epidemiology[J]. Rev Med Virol,2000,10(2):119-133.
[3] Shu YL. Reflection on the history and development of influenza surveillance[J]. Chinese Journal of Epidemiology,2011,32(4):334-336. (in Chinese) 舒跃龙.流感监测的发展历史及思考[J]. 中华流行病学杂志,2011,32(4):334-336.
[4] Lin M, Li YH, Dong BQ. Current status of application of predicting and preparedness of communicable diseases in China[J]. China Tropical Medicine,2010,10(3):308-309, 348. (in Chinese) 林玫,李永红,董柏青.传染病预测预警方法在我国的应用现状[J]. 中国热带医学,2010,10(3):308-309, 348.
[5] Zhang YX. Medical statistic prediction[M]. Beijing:Science and Technology of China Press,1995:4-96. (in Chinese) 章扬熙.医学统计预测[M]. 北京:中国科学技术出版社, 1995:4-96.
[6] Wang RP, Long Y, Liu HH, et al. A study of early detection for 8 communicable diseases by control graph method in Songjiang district of Shanghai, China[J]. Chinese Journal of Preventive Medicine,2014,48(1):53-57. (in Chinese) 王瑞平,龙云,刘会会,等. 上海市松江区8种重点传染病控制图法预警界值优选分析[J]. 中华预防医学杂志,2014,48(1):53-57.
[7] Yang WZ, Xing HX, Wang HZ, et al. A study on early detection for seven infectious diseases[J]. Chinese Journal of Epidemiology,2004,25(12):1039-1041. (in Chinese) 杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究[J]. 中华流行病学杂志,2004,25(12):1039-1041.
[8] Kumar V, Mangal A, Panesar S, et al. Forecasting malaria cases using climatic factors in Delhi, India:a time series analysis[J]. Malar Res Treat,2014:482851.
[9] Martinez EZ, Silva EASD, Fabbro ALD. A SARIMA forecasting model to predict the number of cases of dengue in Campinas, State of Sao Paulo, Brazil[J]. Rev Soc Bras Med Trop,2011,44(4):436-440.
[10] Yu HK, Kim NY, Kim SS, et al. Forecasting the number of human immunodeficiency virus infections in the korean population using the autoregressive integrated moving average model[J]. Osong Public Health Res Perspect,2013,4(6):358-362.
[11] Zheng YL, Zhang LP, Zhang XL, et al. Forecast model analysis for the morbidity of tuberculosis in Xinjiang, China[J]. PLoS One,2015,10(3):e0116832.
[12] Tan T, Chen LZ, Liu FQ. Model of multiple seasonal autoregressive integrated moving average model and its application in prediction of the hand-foot-mouth disease incidence in Changsha[J]. Journal of Central South University:Medical Science,2014,39(11):1170-1176. (in Chinese) 谈婷,陈立章,刘富强.乘积季节自回归积分滑动平均模型在长沙市手足口病发病率预测中的应用[J]. 中南大学学报:医学版,2014,39(11):1170-1175.
[13] Zhang W, Zhang YQ, Yang X. Model of multiple seasonal ARIMA and its application to data in time series[J]. Acta Academiae Medicinae Militaris Tertiae,2002,24(8):955-957. (in Chinese) 张蔚,张彦琦,杨旭.时间序列资料ARIMA季节乘积模型及其应用[J]. 第三军医大学学报,2002,24(8):955-957.
[14] Meng L, Wang XH, Li JS, et al. Dynamic prediction on the number of influenza-like cases in Gansu province based on data from the influenza sentinel surveillance program, from 2006 to 2011[J]. Chinese Journal of Epidemiology,2012,33(11):1155-1158. (in Chinese) 孟蕾,王新华,李娟生,等. 甘肃省2006-2011年哨点监测流感样病例动态预警分析[J]. 中华流行病学杂志,2012,33(11):1155-1158.
[15] Wang RP, Chun YL, Bi AH, et al. A study of early detection for influenza in Songjiang district of Shanghai[J]. Chinese Primary Health Care,2010,24(7):77-78. (in Chinese) 王瑞平,春雅丽,毕安华,等. 上海市松江区流行性感冒控制图法预警界值优选研究[J]. 中国初级卫生保健,2010,24(7):77-78.
[16] Yang WZ, Lan YJ, Li ZJ, et al. The application of national outbreak automatic detection and response system, China[J]. Chinese Journal of Epidemiology,2010,31(11):1240-1244. (in Chinese) 杨维中,兰亚佳,李中杰,等.国家传染病自动预警系统的设计与应用[J]. 中华流行病学杂志,2010,31(11):1240-1244.
[17] Costagliola D, Flahault A, Galinec D, et al. A routine tool for detection and assessment of epidemics of influenza-like syndromes in France[J]. Am J Public Health,1991,81(1):97-99.
[18] Snacken R, Lion J, Van Casteren V, et al. Five years of sentinel surveillance of acute respiratory infections (1985-1990):The benefits of an influenza early warning system[J]. Eur J Epidemiol,1992,8(4):485-490.