2. Department of Epidemiology, School of Public Health, Fudan University, Shanghai 200032, China
2. 复旦大学公共卫生学院流行病学教研室, 上海 200032
结核病不仅是严重危害公众健康的全球性公共卫生问题[1], 更是社会经济、居民健康水平等社会宏观因素的一种外在表现[2]。据世界卫生组织(WHO)估计[3],2011年结核病患病率最低0.65/10万 (卢森堡),最高1372/10万(塞拉利昂),各国结核病患病率差异大,影响因素多且复杂[4,5]。既往对影响结核病患病率因素的研究,都局限在局部地区、特定人群,较少从宏观角度揭示影响全球结核病疫情起伏变化的原因。本研究利用全球214个国家结核病及其他相关指标,旨在排除不同国家之间结核病患病率不均衡的影响,从宏观角度探讨结核病患病率与性别比例、年龄、社会经济发展、HIV/AIDS蔓延等因素之间的关系,为从全球角度预测结核病疫情发展趋势并从宏观角度制定遏制结核病患病率增长的措施提供依据。
本研究从WHO和世界银行开放式数据库中收集全球214个国家1995 2009年的结核病患病率、人口构成比(0~14岁、15~64岁、≥65岁)、性别比例、人口总数、医疗卫生总支出、人均医疗卫生支出、国内生产总值(GDP)、城镇人口比例、农村人口比例、15~49岁人口艾滋病病毒感染率等15个指标。其中,结核病患病率是指每10万人中,新增肺结核、痰涂片阳性、肺外结核病例的估计数;人均医疗卫生支出为公共和与私营卫生支出之和与总人口的比率;15~49岁人口艾滋病病毒感染率指15~49岁感染艾滋病病毒的人口占总人口的百分比。相关指标的定义与赋值详见世界银行开放式数据库。
1.2 分析方法1.2.1 描述性分析
对收集到的指标进行描述性分析,包括最小值、均数、中位数、最大值;分析各指标的分布特征,对不满足正态分布的指标通过对数变化等方法,使其尽量满足正态/近似正态分布。
1.2.2 单因素分析以结核病患病率为因变量,以人口构成比、性别比、人口总数、GDP、医疗卫生总支出百分比、公共卫生服务支出百分比、人均医疗卫生支出、城镇/农村人口比例、15~49岁人口艾滋病病毒感染率为自变量,采用单因素线性回归进行单因素分析。
1.2.3 多因素分析根据结核病发病机制、因果推断的联系、线性回归模型中的条件指数及数据中的缺失比例,避免自变量之间产生自相关后,选择对结核病患病率有统计学意义的指标进行分析,特别是分类考虑指标的纳入,如人口学指标(人口构成、性别比)、经济学指标(GDP、医疗卫生总支出百分比、公共卫生服务支出百分比、人均医疗卫生支出)、社会学指标(人口总数、城镇/农村人口比例)、生物学指标(15~49岁人口艾滋病病毒感染率)对结核病患病率的影响。采用广义线性模型(GLM)进行回归分析。
1.3 统计学分析所有数据整理、数据分析通过SAS 9.1软件完成。在统计学检验过程中,检验水平α=0.05。
收集全球214个国家的结核病患病率、人口学指标等。其中,结核病患病率在0~1257/10万之间,各指标的缺失比例介于1.5%~32.9%,见表1。除了结核病治愈率、0~14岁、15~64岁年龄别构成比、男女性比例、医疗卫生支出百分比、公共医疗支出百分比、城镇人口比例、农村人口比例指标外,对结核病患病率、人口总数、65岁以上年龄、GDP、15~49岁人口艾滋病病毒感染率进行对数变换(自然对数)后,各指标近似服从正态分布。
表 1 描述性分析结果Table 1 Descriptive analysis results
指标 | 结核病患病率 (/10万) |
年龄组(岁) | 性别 | 人口总数 (人) |
GDP (美元) |
||||
0~ | 15~ | ≥65 | 男性 | 女性 | |||||
缺失比例(%) | 8 | 12.8 | 12.8 | 12.8 | 12.8 | 12.8 | 1.5 | 9.7 | |
最小值 | 0 | 12 | 46 | 0 | 46 | 25 | 9 227 | 1.1×107 | |
均数 | 134 | 32 | 61 | 7 | 50 | 50 | 29 247 287 | 2.0×1011 | |
中位数 | 68 | 32 | 63 | 5 | 50 | 50 | 5 243 328 | 9.8×109 | |
最大值 | 1257 | 51 | 85 | 22 | 75 | 54 | 1 331 380 000 | 1.4×1013 |
指标 | 医疗卫生总 支出百分比 | 公共医疗卫生 支出百分比 | 人均医疗卫生 支出 (美元) | 城镇人口比例 (%) | 农村人口比例 (%) | 15~49岁人口 艾滋病病毒感染率(%) |
缺失比例(%) | 13.7 | 13.8 | 13.5 | 3.1 | 3.6 | 32.9 |
最小值 | 0 | 2 | 0 | 7 | 0 | 0.1 |
均数 | 6 | 57 | 620 | 55 | 45 | 2.0 |
中位数 | 6 | 59 | 139 | 55 | 40 | 0.3 |
最大值 | 20 | 100 | 8262 | 100 | 90 | 27.0 |
2.2 单因素分析
单因素分析结果提示,肺结核患病率与年龄别构成比(0~14岁、15~64岁、≥65岁)、人口总数、GDP、医疗卫生总支出百分比、公共医疗卫生支出百分比、人均医疗卫生支出、城镇和农村人口比例、15~49岁人口艾滋病病毒感染率之间的相关性差异有统计学意义(P<0.01);肺结核患病率与男性或女性比例之间的相关性差异无统计学意义(P=0.31),见表2。
表 2 单因素分析结果Table 2 Univariate analysis results
指 标 | ρ值 | t/F值 | P值 | OR值 | 95%CI |
年龄别(岁)构成比 | |||||
0~ | 0.0883 | 39.84 | <0.01 | 1.092 | 1.088~1.097 |
15~ | -0.1254 | -32.71 | <0.01 | 0.882 | 0.876~0.889 |
≥65岁(对数) | -1.4372 | -40.14 | <0.01 | 0.238 | 0.221~0.255 |
性别比例 | |||||
男性 | 0.0160 | 1.02 | 0.31 | 1.016 | 0.985~1.048 |
女性 | -0.0160 | -1.02 | 0.31 | 0.984 | 0.954~1.015 |
人口总数(对数) | 0.0706 | 3.58 | <0.01 | 1.073 | 1.032~1.116 |
GDP(对数) | -0.3096 | -24.15 | <0.01 | 0.733 | 0.715~0.752 |
医疗卫生总支出百分比 | -0.2323 | -18.85 | <0.01 | 0.793 | 0.774~0.812 |
公共医疗卫生支出百分比 | -0.0292 | -19.94 | <0.01 | 0.971 | 0.968~0.974 |
人均医疗卫生支出(对数) | -0.5748 | -49.46 | <0.01 | 0.563 | 0.550~0.576 |
城镇/农村人口比例 | |||||
城镇人口比例 | -0.0348 | -32.25 | <0.01 | 0.966 | 0.964~0.968 |
农村人口比例 | 0.0339 | 30.80 | <0.01 | 1.034 | 1.032~1.037 |
15~49岁人口艾滋病 病毒感染率 | 0.4639 | 27.92 | <0.01 | 1.590 | 1.539~1.643 |
国家 | - | 530.32 | <0.01 | -(1) |
2.3 多因素分析
因为年龄组之间、男女性别比例之间、城乡人口比例之间、人口总数和GDP与医疗卫生总支出、公共医疗卫生支出、人均医疗卫生支 出之间存在有相关性,因此除15~49岁人口艾滋病病毒感染率和国家指标外,选取15~64岁年龄组构成比、≥65岁年龄组构成比、男性比例、人均医疗卫生支出和城镇人口比例指标纳入模型中,构建多因素模型。多因素模型方差分析结果显示F=810.03,P<0.01,决定系数R2=0.985,说明多因素模型有统计学意义,且所选的7个指标能够解释肺结核患病率指标变异的98.5%。因此,可以采用多因素模型解释肺结核患病率指标的绝大多数变异。
多因素分析结果显示,结核病患病率与15~64岁年龄组构成比、15~49岁人口艾滋病病毒感染率之间存在正相关(ρ>0),差异具有统计学意义(P<0.01);结核病患病率与≥65岁年龄组构成比、男性比例、人均医疗卫生支出之间存在负相关(ρ<0),差异有统计学意义(P<0.01)。在排除其他因素影响后,各个国家之间结核病患病率差异有统计学意义(F=219.10,P<0.01)。结核病患病率与城镇人口比例之间不存在相关性(P>0.05),见表3。
表 3 多因素分析结果Table 3 Multivariate analysis results
指 标 | ρ值 | t/F值 | P值 | OR值 | 95%CI |
年龄别(岁)构成比 | |||||
15~ | 0.019 | 34.05 | <0.01 | 1.019 | 1.013~1.026 |
≥65(对数) | -1.262 | 253.17 | <0.01 | 0.283 | 0.242~0.331 |
男性 | -0.099 | 60.32 | <0.01 | 0.905 | 0.883~0.928 |
人均医疗卫生支出(对数) | -0.072 | 36.14 | <0.01 | 0.930 | 0.909~0.952 |
城镇人口比例 | -0.004 | 2.12 | 0.15 | 0.996 | 0.991~1.001 |
15~49岁人口艾滋病病毒感染率 | 0.065 | 20.18 | <0.01 | 1.067 | 1.037~1.097 |
国家 | - | 219.10 | <0.01 | -(1) |
3 讨论
既往对结核病患病率影响因素的研究大多集中在个体水平[6,7],很少从宏观角度探讨影响结核病患病率的危险因素。随着全球各国信息资源的发布以及包括WHO、世界银行在内的众多国际组织及机构对全球各国经济、卫生等多种调查、监测数据的共享,研究人员获取信息的手段逐步向形式多样、方便快捷的趋势发展,这使得科学数据和信息呈爆炸性增长[8]。随着大数据时代的到来,研究者利用各国共享数据从更为宏观的角度分析疾病与各种基础信息之间的关系成为可能。本研究旨在利用WHO和世界银行发布的全球结核病及各国基础信息,从宏观角度探讨影响结核病患病率的危险因素,从另一个视角分析预测结核病的流行状况。
在排除其他因素影响后,15~64岁年龄别构成比、≥65岁年龄别构成比、男性比例、人均医疗卫生支出、15~49岁人口艾滋病病毒感染率与结核病患病率之间的相关性存在统计学意义(P<0.01),不同国家之间的结核病患病率差异具有统计学意义(P<0.01)。
虽然多因素分析结果显示男性比例与结核病患病率存在统计学相关性(P<0.01),但是OR=0.905,接近于1,并且单因素分析也提示男女性比例与结核病患病率均无统计学相关性(P>0.05),因此认为性别比例对结核病患病率的影响较小,即不存在随着男性或女性比例增高而结核病患病率增高的现象。但在多因素分析时,男女比例可以作为混杂因素进行校正,以排除其影响。
多因素分析结果提示,人均医疗卫生支出与结核病患病率之间存在负相关,即随着人均医疗卫生支出的增加,结核病患病率会随之降低。多因素分析结果的OR值(0.930)距离无效假设OR=1的距离较单因素分析结果OR值(0.563)更近,说明其他因素夸大了人均医疗卫生支出对结核病患病率的影响,即人均医疗卫生支出对降低结核病患病率有作用,但是其影响没有想象中那么大。
多因素分析结果显示≥65岁年龄别构成比与结核病患病率之间存在负相关。该结果与既往研究结果相反[1,9,10]。分析原因主要是214个国家中,老年结核病患者未能及时被发现是主要原因之一[11]。研究所用到的数据是各个国家疾病监测系统中被动发现的数据,与实际结核病患者的数量仍有一定差距。利用数据库中病例发现工作较好的几个发达国家(美国、日本、法国等)的数据分析后发现,随着≥65岁年龄别构成比的增加,结核病患病率随之增加(ρ>0);而其他发展中国家,特别是结核病高疫情国家的数据分析显示,随着≥65岁年龄别构成比的增加,结核病患病率随之降低(ρ<0)。另外老年人结核病病死率远高于年轻人[12],特别是年龄超过70岁后[13],导致老年人中因患结核病而死亡的人数显著增加,实际老年结核病患者数减少。 上述因素可能是导致随着≥65岁年龄别构成比的增加,结核病患病率随之减少的原因。因此针对这些原因,提示各国均需要加强结核病患者的病例发现工作,特别老年中结核病患者的发现,必要时采取一些主动发现措施,以尽早发现特殊人群中的结核病患者。
单因素分析时,受其他因素的影响,15~64岁年龄别构成比对结核病患病率的影响OR=0.882;在排除其他因素的影响后,15~64岁年龄别构成比对结核病患病率的影响OR=1.009。分析结果表明,虽然15~64岁年龄别构成比对结核病患病率之间的相关性存在统计学意义(P<0.01),但是由于单因素分析和多因素分析OR值及其置信区间均在1附近 ,因此认为15~64岁年龄别构成比对结核病患病率的影响作用较小。
15~49岁人口艾滋病病毒感染率与结核病患病率之间存在正相关,即随着15~49岁人口艾滋病病毒感染率的升高,结核病患病率也会随之增加。因此,控制艾滋病的流行也是控制结核病传播的一个关键因素[14]。
综上所述,为了降低结核病患病率,减少结核病患者数量,各国应积极增加对医疗卫生服务的投入,增加人均医疗卫生支出,同时控制艾滋病的传播,加强结核病患者的病例发现工作,在老年人群中开展主动筛查措施以提高患者发现率。
本研究根据世界银行开放数据库进行二次数据分析。因此数据变量的选择受到既有数据库的限制。虽然本研究从宏观水平分析了多项指标信息与结核病患病率之间的关系,但是由于一些影响结核病患病率的因素尚未纳入到监测系统中[15],例如糖尿病患病情况等指标[16],因此无法评价与校正这些指标对结核病患病率的影响。这些因素中,有些因素在个体水平已经证明其对结核病的发病和感染有影响[17]。但是这些因素未被纳入可能会对分析结果造成一定的影响。另外,来自于各国统计监测系统的数据可能存在信息偏移,也会对分析结果造成一定影响。
[2] Lonnroth K, Corbett E, Golub J, et al. Systematic screening for active tuberculosis: rationale, definitions and key considerations[J]. Int J Tuberc Lung Dis,2013, 17(3):289-298.
[3] World Health Organization. Global tuberculosis report 2013[M]. Geneva: World Health Organization, 2013.
[4] Davies P. Risk factors for tuberculosis[J]. Monaldi Arch Chest Dis, 2005, 63(1):37-46.
[5] Narasimhan P, Wood J, Macintyre CR, et al. Risk factors for tuberculosis[J]. Pulmonary Medicine,2013:828-939.
[6] Zou B, Xing LB, Jia BZ, et al. Meta analysis on risk factors for high prevalence of tuberculosis in China[J]. Journal of Clinical Pulmonary Medicine, 2011, 16(5):736-738.(in Chinese) 邹博, 邢利宝, 贾本治, 等.中国人肺结核病高患病率的危险因素Meta分析[J]. 临床肺科杂志, 2011, 16(5):736-738.
[7] Ferrara G, Murray M, Winthrop K, et al. Risk factors associated with pulmonary tuberculosis: smoking, diabetes and anti-TNFalpha drugs[J]. Curr Opin Pulm Med,2012, 18(3):233-240.
[8] Adler-Milstein J, Jha AK. Healthcare's "big data" challenge[J]. Am J Manag Care,2013, 19(7):537-538.
[9] Cruz-hervert LP, Garcia-garcia L, Ferreyra-reyes L, et al. Tuberculosis in ageing: high rates, complex diagnosis and poor clinical outcomes[J]. Age Ageing,2012, 41(4):488-495.
[10] Zhang X, Andersen AB, Lillebaek T, et al. Effect of sex, age, and race on the clinical presentation of tuberculosis: a 15-year population-based study[J]. Am J Trop Med Hyg,2011, 85(2):285-290.
[11] Vanthoog AH, Marston BJ, Ayisi JG, et al. Risk factors for inadequate TB case finding in Rural Western Kenya: a comparison of actively and passively identified TB patients[J]. PLoS One,2013, 8(4):e61162.
[12] Fielder JF, Chaulk CP, Dalvi M, et al. A high tuberculosis case-fatality rate in a setting of effective tuberculosis control: implications for acceptable treatment success rates[J]. Int J Tuberc Lung Dis,2002, 6(12):1114-1117.
[13] Zhang YX Analysis on survial of tuberculosis patients and countermeasures to reduce case fatality in urban area of Pudong, Shanghai[D]. Shanghai: Fudan University, 2012.(in Chinese) 张懿行. 浦东新区城市人口肺结核病人生存分析及降低病死率对策研究[D]. 上海:复旦大学, 2012.
[14] Gray JM, Cohn DL. Tuberculosis and HIV coinfection[J]. Semin Respir Crit Care Med,2013, 34(1):32-43.
[15] Liang L, Wu Q, Gao L, et al. Factors contributing to the high prevalence of multidrug-resistant tuberculosis: a study from China[J]. Thorax,2012, 67(7):632-638.
[16] Koo BK. Diabetes mellitus and tuberculosis[J]. Diabetes & Metabolism,2013, 37(4):249-251.
[17] Park HH, Girdler-Brown BV, Churchyard GJ, et al. Incidence of tuberculosis and HIV and progression of silicosis and lung function impairment among former Basotho gold miners[J]. Am J Ind Med,2009, 52(12):901-908.