扩展功能
文章信息
- 李越, 陈涛, 杨静, 汪立杰, 祝菲, 王大燕, 舒跃龙
- LI Yue, CHEN Tao, YANG Jing, WANG Li-jie, ZHU Fei, WANG Da-yan, SHU Yue-long
- 2009年后我国北方地区流感样病例的动态预警分析
- Dynamic surveillance for influenza like illness in northern China after pandemic of influenza A (H1N1) in 2009
- 疾病监测, 2016, 31(2): 96-100
- Disease Surveillance, 2016, 31(2): 96-100
- 10.3784/j.issn.1003-9961.2016.02.004
-
文章历史
- 收稿日期: 2015-11-18
流行性感冒(流感)是一种传染性极强的疾病,历史上一共发生过4次大流行,均给人类健康和社会经济造成了巨大的损失[1, 2]。监测预警是预防、控制流感暴发和流行的主要手段,通过建立早期预警模型,可以使流感防控工作更具针对性、预见性和主动性。2003年以来我国的流感监测系统得到快速发展[3],更好地利用监测数据实现早期预警,具有重要的现实意义。2009年流感大流行之后,流感流行趋势随之改变,然而目前我国对于大流行之后流感活动预警方面研究并不充分。ARIMA模型和控制图法分别是传染病预测预警中常见的定量和定性预测模型[4]。本研究将ARIMA模型与控制图法进行有效结合,基于20102015年我国北方地区流感哨点监测数据,探索大流行后北方地区流感样病例预警模式,实现动态预警并评价预测预警效果,为流感的防控工作提供技术支持。
1 材料与方法 1.1 资料来源以2010年第1周至2015年第32周中国北方地区报告的流感样病例(ILI)占门急诊病例百分比(ILI%)为原始数据。数据来源于“中国流感监测信息系统”。
1.2 方法 1.2.1 建立预警模型根据流行控制图预警模型原理[5],以2010-2013年4年同周次(如第5周)的ILI%,将时间向前向后各移动一个单位[6, 7],以这些周次的数据(第4~6周)为基线数据(移动窗口大小为“4×3”=12),计算指定的百分位数(P50、P60、P70、P80、P90、P95),作为候选的预警界值,建立预警模型。
1.2.2 确定流行标准经典的“流行”定义指某种疾病的发病水平超过历年一般水平,根据杨维中等[7]的研究结果,以大于历年(本研究为20102013年)周病例数的“x+2s”作为判断疾病流行的标准,将2014年每周实际发生的ILI%与该流行标准进行比较,大于该标准则判断为流行,同时发出预警信号,否则判断为散发,不发出预警信号,该结果作为判断是否需要预警的金标准。
1.2.3 选择合适的预警值将2014年每周实际发生的ILI%分别与6个候选预警界值进行比较,超过预警界值则进行预警;将各候选模型的预警结果与根据流行标准(x+2s)判断的预警结果进行比较,以此计算各候选值模型的灵敏度、特异度、阳性预测值、阴性预测值,并绘制ROC曲线(receiver-operating characteristic curve),参考曲线上最左上角的点,选出合适的预警界值。
1.2.4 拟合ARIMA模型根据2010-2014年每周ILI%数据,按照ARIMA模型的建模步骤进行[8, 9, 10, 11, 12]:首先绘制时间序列图,通过数据的平稳化处理、模型识别定阶、参数估计和检验、模型诊断,选出最优模型。按照不同时间间隔对2015年132周数据进行迭代预测,时间间隔分别为单周、2周、4周、16周、32周,通过与实际ILI%进行比较,选择最佳预测时间间隔。
1.2.5 评价预测预警效果将最佳时间间隔的预测值与预警界值比较,如果预测值超出预警界值则发出报警;然后以该周实际发生的ILI%和预警界值比较判断是否报警,比较预测报警与实际报警的一致率,评价预测预警效果。
2 结果 2.1 ARIMA模型拟合以及预测时间间隔选择 2.1.1 序列的平稳化绘制2010-2014年中国北方地区哨点监测ILI%时间序列图(图 1)。可以看出该序列波动性较大,具有明显的季节性周期,冬春季节达到发病高峰,序列不平稳。对原序列进行自然对数转化以平稳序列的方差,并且对序列进行步长为52一阶季节差分。为避免序列过度差分造成有效信息的丢失,序列的季节差分后,即进行序列的平稳性检验。依据ADF单位根检验结果显示,检验的T统计量为-4.629 471(P <0.01),说明序列平稳性良好,可以对季节差分后的序列进行建模。
![]() |
图 1 2010-2014年我国北方地区ILI%时间序列 Figure 1 Time series of ILI% in north China, 2010-2014 |
由于在序列平稳化阶段进行了周期为52的一阶季节差分,故选择 D=1,d=0的乘积季节ARIMA(p,d,q)×(P,D,Q)52模型。绘制ACF和PACF图(图 2),由图 2可以看出,ACF拖尾,PACF 1阶截尾,提示选择AR模型,则P=1,q=0。相关研究提示:P和Q超过高阶的情况很少[13],所以本研究选择对P和Q分别取0和1,逐个进行试验,最后通过模型参数检验,比较赤池信息准则AIC值和拟合优度R2值,选定ARIMA(1,0,0)×(1,1,0)52为最优模型,模型的拟合度R2=0.65,模型AIC值最小为-2.03,模型参数估计和参数检验结果如表 1。
![]() |
图 2 季节差分后序列的ACF和PACF函数图 Figure 2 ACF and PACF after seasonal difference |
参数 | 系数 | 标准差 | t值 | P值 |
AR(1) | 0.681 29 | 0.057 37 | 11.875 47 | 0.000 0 |
SAR(52) | -0.457 93 | 0.066 892 | -6.845 693 | 0.000 0 |
注:AR(1): P=1时的模型参数;SAR(52): P=1时的模型参数。 |
对ARIMA(1,0,0)×(1,1,0)52模型的残差序列进行Q检验,结果如图 3。Q统计量P>0.05,序列为白噪声序列,不存在相关性,序列信息提取充分,模型构建成功。
![]() |
图 3 残差序列ACF和PACF函数图 Figure 3 ACF and PACF figure of the residual error sequence |
用ARIMA(1,0,0)×(1,1,0)52模型,通过不断迭代法,按照单周、2周、4周、16周、32周等不同时间长度,对2015年132周的数据进行预测,并用实际发生值评价预测效果,不同预测时间长度的均方根误差、平均绝对值误差以及平均相对误差百分比见表 2。其中单周预测的预测精度最高,随着预测时间的延长,预测的准确度逐渐下降,通过迭代计算的方式,不断为模型加入新数据,起到了模型校正效果,提高了预测的准确性。
指标 | 单周预测 | 2周预测 | 4周预测 | 16周预测 | 32周预测 |
均方根误差 | 0.34 | 0.37 | 0.41 | 0.45 | 0.47 |
平均绝对误差 | 0.21 | 0.24 | 0.31 | 0.32 | 0.35 |
平均相对误差(%) | 7.08 | 8.26 | 10.49 | 10.99 | 12.18 |
根据杨维中等[7]定义“流行”的方法,2014年有两周超出了流行线,应该发出预警信号。各候选界值均能正确进行预警,敏感度达到100%,特异度随着预警界值的提高而逐步提高,各候选预警界值的灵敏度、特异度、阳性预测值、阴性预测值如表 3;各候选预警界值ROC曲线如图 4,最终选定流感样病例的预警界值为第95百分位数,此时灵敏度为100%,特异度为96%。
指标 | 敏感度(%) | 特异度(%) | 阳性预测值(%) | 阴性预测值(%) |
P 50 | 100 | 68 | 11 | 100 |
P 60 | 100 | 80 | 17 | 100 |
P 70 | 100 | 86 | 22 | 100 |
P 80 | 100 | 90 | 29 | 100 |
P 90 | 100 | 94 | 40 | 100 |
P 95 | 100 | 96 | 50 | 100 |
![]() |
图 4 ILI预警的ROC曲线(控制图法) Figure 4 ROC curve of ILI early warning |
根据ARIMA模型不同时间长度的预测效果,同时兼顾预警时效性,最终选定2周动态预测模型。将2015年132周的2周预测预警结果与2015年实际预警结果进行比较,结果见表 4和图 5。利用季节乘积ARIMA模型结合控制图法构建的动态预警模型,其动态预警结果与实报预警一致率为100%。
2015年周次 | ILI%P 95预警线 | ILI%实报值 | ARIMA模型2周预测值 | 动态预警符合情况 |
1 | 4.84 | 4.11 | 4.71 | 1 |
2 | 4.86 | 3.47 | 4.29 | 1 |
3 | 4.80 | 3.57 | 3.64 | 1 |
4 | 4.71 | 3.08 | 3.50 | 1 |
5 | 4.51 | 3.00 | 3.56 | 1 |
6 | 4.59 | 2.89 | 3.41 | 1 |
7 | 4.59 | 2.72 | 2.87 | 1 |
8 | 4.25 | 3.77 | 2.46 | 1 |
9 | 3.33 | 2.87 | 3.33 | 1 |
10 | 3.33 | 2.57 | 3.06 | 1 |
11 | 3.30 | 2.54 | 2.71 | 1 |
12 | 3.30 | 2.61 | 2.66 | 1 |
13 | 3.22 | 2.56 | 2.65 | 1 |
14 | 3.17 | 2.61 | 2.74 | 1 |
15 | 3.13 | 2.46 | 2.60 | 1 |
16 | 3.04 | 2.33 | 2.72 | 1 |
17 | 3.16 | 2.37 | 2.39 | 1 |
18 | 3.12 | 2.42 | 2.70 | 1 |
19 | 3.12 | 2.31 | 2.34 | 1 |
20 | 2.92 | 2.35 | 2.43 | 1 |
21 | 2.94 | 2.32 | 2.39 | 1 |
22 | 2.94 | 2.31 | 2.48 | 1 |
23 | 3.09 | 2.48 | 2.39 | 1 |
24 | 3.08 | 2.54 | 2.51 | 1 |
25 | 3.12 | 2.56 | 2.42 | 1 |
26 | 2.98 | 2.57 | 2.59 | 1 |
27 | 2.93 | 2.47 | 2.59 | 1 |
28 | 2.82 | 2.54 | 2.51 | 1 |
29 | 2.78 | 2.55 | 2.51 | 1 |
30 | 2.78 | 2.43 | 2.54 | 1 |
31 | 2.76 | 2.43 | 2.39 | 1 |
32 | 2.73 | 2.54 | 2.37 | 1 |
注:1代表符合,0代表不符合。 |
![]() |
图 5 2015年132周北方地区ARIMA-流行控制图模型动态预测预警效果 Figure 5 Dynamic warning effect of ARIMA-control chart model in northern China, 1st-32nd week, 2015 |
早期发现疾病暴发或者流行是公共卫生部门应对疫情的重要前提。近年来,随着国家流感监测系统的建立和完善,流感监测网络逐步稳定,收集到大量可靠的监测数据,对这些监测数据有效分析是早期发现和控制流感疫情的重要手段。2009年甲型H1N1流感大流行之后,我国流感流行模式也随之发生改变,大流行之后新的流感预警模式有待探索。流行控制图作为一种经典的“预警”方法,在具有季节性流行或者周期流行规律的传染病中具有广泛应用[14]。既往流感的预警大多是利用该方法,通过事先设定预警界值与当前流感ILI%或者ILI病例数进行对比,以提出预警。这种预警方法为早期发现流感暴发或者流行提供了有效手段,但是单纯使用该方法存在一定的滞后性。本研究通过将季节乘积ARIMA预测模型与流行控制图结合的方式,实现对我国北方地区ILI%的双周动态预测预警,提高了预警的时效性,预测预警与实际预警的一致率为100%,为早期发现疫情提供了可能,为疫情的准备工作争取了时间。另外,本研究选择第95百分位数作为ILI的预警界值,与之前一些流感预警的研究结果一致[6, 15],但是与国家推荐流感预警界值存在一定差异[16],在国家推荐流感预警界值研究中研究人员为了提高预警的灵敏度,预警阈值选择过于保守,存在较多假阳性预警信号。本研究通过对各候选预警界值的灵敏度、特异度、阳性预测值以及阴性预测值进行综合比较,并且通过ROC曲线的绘制,最终确定P95为我国北方地区ILI%的预警阈值,灵敏度为100%,特异度为96%,预警的特异度大大提高。研究表明ARIMA(1,0,0)×(1,1,0)52模型,单周迭代计算的预测精度最高,但是在实际生活中单周预测可能不能满足疾病控制工作时效性的要求。因此本研究对模型不同时间长度的预测效果进行了评价,通过比较认为模型的2周预测效果较佳,同时能够兼顾预警的时效性需求,可以用于今后对北方地区ILI的预警工作中。
尽管如此,本研究依然存在一些局限性。第一ARIMA模型是一种短期预测模型,长期预测误差会越来越大,需要随时对模型进行校正,因此针对ILI的长期预测模型有待于开发。第二,本研究从ILI入手,意图达到对流感暴发或流行进行预警的目的,虽然取得了较好的预警效果,一定程度上为流感的防控工作提供了参考,但是ILI的影响因素复杂,除了与流感病毒流行有关外,还与气温、相对湿度等有着密切的联系;因此在实际疫情防控中,需要结合实验室变异株和耐药株等的综合分析,提出预警和应对措施。第三,流行控制图法一般是利用发病前几年的数据来划定预警线,在实际工作中,适宜的预警界值需要定期进行调整。此外,控制图法进行流感预警的关键在于确定“流行”标准,但是目前国际上尚未制定统一的标准[17, 18]。本文采用杨维中等[7]提出的大于 “x+2s” 作为流行标准,但流行标准定义过高或者过低将对后续流行界值的选择造成偏差,因此在以后的预警研究中仍需对流行标准以及预警界值选择的适宜性进行深入综合的分析和评价。
[1] | Molbak K, Widgren K, Jensen KS, et al. Burden of illness of the 2009 pandemic of influenza A (H1N1) in Denmark[J]. Vaccine,2011,29 Suppl 2:B63-B69. |
[2] | Oxford JS. Influenza a pandemics of the 20th century with special reference to 1918:virology, pathology and epidemiology[J]. Rev Med Virol,2000,10(2):119-133. |
[3] | Shu YL. Reflection on the history and development of influenza surveillance[J]. Chinese Journal of Epidemiology,2011,32(4):334-336. (in Chinese) 舒跃龙.流感监测的发展历史及思考[J]. 中华流行病学杂志,2011,32(4):334-336. |
[4] | Lin M, Li YH, Dong BQ. Current status of application of predicting and preparedness of communicable diseases in China[J]. China Tropical Medicine,2010,10(3):308-309, 348. (in Chinese) 林玫,李永红,董柏青.传染病预测预警方法在我国的应用现状[J]. 中国热带医学,2010,10(3):308-309, 348. |
[5] | Zhang YX. Medical statistic prediction[M]. Beijing:Science and Technology of China Press,1995:4-96. (in Chinese) 章扬熙.医学统计预测[M]. 北京:中国科学技术出版社, 1995:4-96. |
[6] | Wang RP, Long Y, Liu HH, et al. A study of early detection for 8 communicable diseases by control graph method in Songjiang district of Shanghai, China[J]. Chinese Journal of Preventive Medicine,2014,48(1):53-57. (in Chinese) 王瑞平,龙云,刘会会,等. 上海市松江区8种重点传染病控制图法预警界值优选分析[J]. 中华预防医学杂志,2014,48(1):53-57. |
[7] | Yang WZ, Xing HX, Wang HZ, et al. A study on early detection for seven infectious diseases[J]. Chinese Journal of Epidemiology,2004,25(12):1039-1041. (in Chinese) 杨维中,邢慧娴,王汉章,等.七种传染病控制图法预警技术研究[J]. 中华流行病学杂志,2004,25(12):1039-1041. |
[8] | Kumar V, Mangal A, Panesar S, et al. Forecasting malaria cases using climatic factors in Delhi, India:a time series analysis[J]. Malar Res Treat,2014:482851. |
[9] | Martinez EZ, Silva EASD, Fabbro ALD. A SARIMA forecasting model to predict the number of cases of dengue in Campinas, State of Sao Paulo, Brazil[J]. Rev Soc Bras Med Trop,2011,44(4):436-440. |
[10] | Yu HK, Kim NY, Kim SS, et al. Forecasting the number of human immunodeficiency virus infections in the korean population using the autoregressive integrated moving average model[J]. Osong Public Health Res Perspect,2013,4(6):358-362. |
[11] | Zheng YL, Zhang LP, Zhang XL, et al. Forecast model analysis for the morbidity of tuberculosis in Xinjiang, China[J]. PLoS One,2015,10(3):e0116832. |
[12] | Tan T, Chen LZ, Liu FQ. Model of multiple seasonal autoregressive integrated moving average model and its application in prediction of the hand-foot-mouth disease incidence in Changsha[J]. Journal of Central South University:Medical Science,2014,39(11):1170-1176. (in Chinese) 谈婷,陈立章,刘富强.乘积季节自回归积分滑动平均模型在长沙市手足口病发病率预测中的应用[J]. 中南大学学报:医学版,2014,39(11):1170-1175. |
[13] | Zhang W, Zhang YQ, Yang X. Model of multiple seasonal ARIMA and its application to data in time series[J]. Acta Academiae Medicinae Militaris Tertiae,2002,24(8):955-957. (in Chinese) 张蔚,张彦琦,杨旭.时间序列资料ARIMA季节乘积模型及其应用[J]. 第三军医大学学报,2002,24(8):955-957. |
[14] | Meng L, Wang XH, Li JS, et al. Dynamic prediction on the number of influenza-like cases in Gansu province based on data from the influenza sentinel surveillance program, from 2006 to 2011[J]. Chinese Journal of Epidemiology,2012,33(11):1155-1158. (in Chinese) 孟蕾,王新华,李娟生,等. 甘肃省2006-2011年哨点监测流感样病例动态预警分析[J]. 中华流行病学杂志,2012,33(11):1155-1158. |
[15] | Wang RP, Chun YL, Bi AH, et al. A study of early detection for influenza in Songjiang district of Shanghai[J]. Chinese Primary Health Care,2010,24(7):77-78. (in Chinese) 王瑞平,春雅丽,毕安华,等. 上海市松江区流行性感冒控制图法预警界值优选研究[J]. 中国初级卫生保健,2010,24(7):77-78. |
[16] | Yang WZ, Lan YJ, Li ZJ, et al. The application of national outbreak automatic detection and response system, China[J]. Chinese Journal of Epidemiology,2010,31(11):1240-1244. (in Chinese) 杨维中,兰亚佳,李中杰,等.国家传染病自动预警系统的设计与应用[J]. 中华流行病学杂志,2010,31(11):1240-1244. |
[17] | Costagliola D, Flahault A, Galinec D, et al. A routine tool for detection and assessment of epidemics of influenza-like syndromes in France[J]. Am J Public Health,1991,81(1):97-99. |
[18] | Snacken R, Lion J, Van Casteren V, et al. Five years of sentinel surveillance of acute respiratory infections (1985-1990):The benefits of an influenza early warning system[J]. Eur J Epidemiol,1992,8(4):485-490. |