基于复杂抽样下艾滋病高危人群基数三来源CMR法调查估计的统计方法及应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:tiankuangfeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:艾滋病(acquired immunodeficiency syndrome,AIDS)是一种因感染人类免疫缺陷病毒(human immunodeficiency virus,HIV)而导致的传染病,是困扰的全球严重公共卫生问题之一。有些人群因自身具有一些感染 HIV 高风险的行为因素(如不安全性行为、多性伴、吸毒等)而更容易感染HIV,这些人群是艾滋病高危人群。艾滋病高危人群基数是艾滋病流行病学研究的核心变量之一,也是全面客观分析和掌握 HIV 感染及艾滋病流行现状和趋势的基础,并可以为艾滋病防治相关政策的制定、卫生资源的有效分配、以及预防控制项目的设计与实施提供科学依据。捕获-标记-再捕获(capture-mark-recapture,CMR)法因具有科学的理论基础,并且经济、简便易行而在艾滋病研究中得到了较为广泛的应用。以往采用CMR法对艾滋病高危人群基数进行研究多以简单随机抽样和/或二来源CMR法居多,而复杂抽样方法(实际调查往往需要的多阶段抽样及可减小抽样误差的分层多阶段抽样等)下多来源CMR法(与二来源CMR法相比使样本更具代表性)的研究未见文献报道。本文拟用复杂抽样(二阶段、分层二阶段、三阶段、分层三阶段随机抽样)方法下三来源CMR法对艾滋病高危人群基数估计进行研究,推导出总体基数的估计量及其方差、方差估计量的统计公式。并采用本文研究的复杂抽样下三来源 CMR 法的调查方法及其统计公式,对 2013 年北京市MSM人群基数、2015年广西壮族自治区女性性工作者(female sex workers, FSW)人群基数进行了科学的实例调查估计。同时对我们研究的二阶段、分层二阶段、三阶段及分层三阶段随机抽样下三来源 CMR 法,进行了信度效度评价。旨在为艾滋病高危人群基数的估计提供科学的调查方法、统计公式及其信度效度评价方法;实例调查估计结果为相关部门制定艾滋病防控策略、合理分配艾滋病防治资源提供了重要的数据。  方法:根据经典抽样理论、方差的性质、区间估计、对数线性模型、正交投影、极大似然估计等数理统计理论方法,在前人研究的简单随机抽样下三来源CMR 法的调查方法及其统计公式的基础上,对二阶段、分层二阶段、三阶段、分层三阶段随机抽样下三来源CMR法,设计出调查方法,推导出总体基数的估计量及其方差、方差估计量的统计公式。并采用研究的二阶段随机抽样下三来源CMR法的调查方法及其统计公式,于2013年9月至12月对北京市MSM人群基数进行了实例调查估计;采用所研究的分层三阶段随机抽样下三来源CMR法的调查方法及其统计公式,于2015年8月至10月对广西壮族自治区FSW人群基数进行了实例调查估计。同时使用统计分析软件 SAS 编程对调查结果进行蒙特卡洛模拟,分别以2013年北京市MSM人群及2015年广西壮族自治区FSW人群的统计量调查计算结果作为模拟总体参数建立模拟总体,分别在不同获取时间段采用复杂抽样下三来源CMR法各模拟抽取100个随机样本,再采用本文推导的三来源均相关的 CMR 法相关公式分别计算不同获取时间段内的 100 个MSM 或 FSW 人群基数的估计值、标准差及总体基数的 95%可信区间,对我们研究的二阶段、分层二阶段、三阶段及分层三阶段随机抽样下三来源CMR法进行信度效度评价。  结果:  1. 本文对二阶段、分层二阶段、三阶段及分层三阶段这些复杂随机抽样下三来源CMR法,首次设计出调查方法,并推导出总体基数的估计量及其方差、方差估计量的统计公式。  2. 本文采用二阶段随机抽样下三来源CMR法于2013年9月15日至12月31日对北京市所有的有北京市户籍与在北京市居住6 个月以上的常住MSM人群进行调查,调查其最近一周、最近一个月以及最近半年是否分别在北京市MSM活动场所、北京市艾滋病自愿咨询检测(HIV voluntary counseling&testing,VCT)门诊所以及MSM网站这三类场所活动过。从北京市的16个区县中随机抽取了6个区县(西城、海淀、昌平、通州、怀柔、密云)作为一级单位;然后再从抽中的6个区县中共随机抽取1,774名MSM作为二级抽样单位。调查结果显示时间段为一周的回收合格问卷为1,771份,估计出以一周为获取时间段的北京市MSM人群的基数为94,715人,渐近标准差为9,418人,95%可信区间为76,256~113,174人。时间段为一个月的回收合格问卷为1,766份,估计出以一个月为获取时间段的北京市MSM人群的基数为81,720人,渐近标准差为8,291人,95%可信区间为65,470~97,970人。时间段为半年的回收合格问卷为1,766份,估计出以半年为获取时间段的北京市MSM人群的基数为71,899人,渐近标准差为7,346人, 95%可信区间为57,501~86,297人。  3. 本文于2015年8月至10月采用分层三阶段随机抽样下三来源CMR法对广西女性性工作者的人群基数进行调查,调查其最近三个月以及最近半年2个时间段内是否分别接受过艾滋病干预服务、在正规医疗机构进行过性病/艾滋病检测以及提供过性服务。从广西壮族自治区的14个地级市中随机抽取了3个地级市(百色、柳州、玉林)作为一级单位;然后分别在这3个地级市中共随机抽取了共9个县(区)作为二级单位(每个一级单位抽取3个区县);再从抽中的9个县(区)所有FSW活动场所共随机抽取三级单位4,267名FSW作为调查对象。分层因素为年龄,根据所调查FSW的年龄分布,以年龄的中位数32岁为界分为二层,小于等于32岁为第一层,大于32岁的为第二层。调查结显示时间段为三个月的回收合格问卷为4,118份,估计出以三个月为获取时间段的广西壮族自治区 FSM 人群的基数为 95,662 人,渐近标准差为 6,922 人,95%可信区间为82,094~109,230人。时间段为半年的回收合格问卷为4,101份,估计出以半年为获取时间段的广西壮族自治区FSM人群的基数为91,416人,渐近标准差为6,612人,95%可信区间为78,456~104,376人。  4. 本文对北京市MSM人群获取时间段为最近一周的二阶段随机抽样下三来源CMR法,采用蒙特卡洛方法模拟调查分析100个样本的结果为:100个总体基数的95%可信区间中有99个包含模拟总体基数;获取时间段为最近一个月的二阶段随机抽样下三来源CMR法,采用蒙特卡洛方法模拟调查分析100个样本的结果为:100个总体基数的95%可信区间中有95个包含模拟总体基数;获取时间段为最近半年的二阶段随机抽样下三来源CMR法,采用蒙特卡洛方法模拟调查分析100个样本的结果为100个总体基数的95%可信区间中有98个包含模拟总体基数。  5. 本文对广西壮族自治区FSW人群获取时间段为最近三个月的分层三阶段随机抽样下三来源CMR法,采用蒙特卡洛方法模拟调查分析100个样本的结果为:100个总体基数的95%可信区间中有96个包含模拟总体基数;获取时间段为最近半年的分层三阶段随机抽样下三来源CMR法,采用蒙特卡洛方法模拟调查分析100个样本的结果为:100个总体基数的95%可信区间中有97个包含模拟总体基数。  结论:  1. 本文研究的二阶段以及分层三阶段随机抽样下三来源CMR法的调查方法及其统计公式分别在北京市MSM人群和广西壮族自治区2015年FSW人群的总体基数调查估计中取得了良好的实际应用效果,为调查估计艾滋病高危人群的基数提供了科学的方法和成功的经验。  2. 采用本文研究的二阶段随机抽样下三来源 CMR 法调查估计出 2013 年北京市 MSM 人群基数 81,720 人(获取时间段为一个月),约占同年龄段男性的1.17%。本文为相关卫生部门提供了信度高效度高的 MSM 高危人群基数,提示相关卫生部门应切实加强对 MSM 人群的精准监测,采取有力高效的精准措施,对艾滋病进行精准防控。对北京市MSM人群不同获取时间段(最近一周、一个月、半年)的二阶段随机抽样下三来源CMR法,采用蒙特卡洛模拟法模拟调查估计出100个样本的100个总体基数的95%可信区间几乎均包含模拟总体基数,说明本文研究的二阶段随机抽样下三来源CMR法的调查方法及其统计公式具有良好的效度与信度,在流行病学调查研究中具有广泛的应用前景。  3. 采用本文研究的分层三阶段随机抽样下三来源CMR法调查估计出广西壮族自治区2015年FSW人群基数为95,662人(获取时间段为三个月),约占广西女性人口的0.42%。本文为相关卫生部门提供了信度高效度高的FSW高危人群基数,提示相关卫生部门应切实加强对FSW人群的精准监测,采取有力高效的精准措施,对艾滋病进行精准防控。对广西壮族自治区FSW人群不同获取时间段(最近三个月、半年)的分层三阶段随机抽样下三来源CMR法,采用蒙特卡洛模拟法模拟调查估计出100个样本的100个总体基数的95%可信区间几乎均包含模拟总体基数,说明本文研究的分层三阶段随机抽样下三来源CMR法的调查方法及其统计公式具有良好的效度与信度,在流行病学调查研究中具有广泛的应用前景。  4. 因分层三阶段抽样各层内即为三阶段抽样,分层三阶段抽样下三来源CMR法信度高效度高的必要条件是三阶段抽样下三来源CMR法信度高效度高,所以可以认为本文研究的三阶段随机抽样下三来源CMR法的调查方法及其统计公式也具有良好的效度与信度,在流行病学调查研究中具有广泛的应用前景。  5. 因无论从统计公式的推导或是抽样方法上,分层三阶段抽样均是在分层二阶段抽样基础上的进一步扩展且更复杂,分层三阶段抽样下三来源CMR法信度高效度高的必要条件是分层二阶段抽样下三来源CMR法信度高效度高,所以可认为本文研究的分层二阶段抽样下三来源CMR法的调查方法及其统计公式也具有良好的效度与信度,在流行病学调查研究中具有广泛的应用前景。  6. 本文研究的分层三阶段及三阶段(各层内即为三阶段)随机抽样下三来源CMR 法的调查方法及其统计公式在广西壮族自治区 FSW 人群的总体基数调查估计中取得了良好的实际应用效果,为调查估计艾滋病高危人群的基数提供了科学的方法和成功的经验。
其他文献
山东煤管局首期煤制气技术培训班于1992年12月21日在济南结束。经过两个半月的培训,学员全部领取了结业证书。近几年,山东统配煤矿煤制气规模迅速扩大,各种制气工艺并存,但
期刊
期刊
期刊
期刊
期刊
期刊
期刊
期刊
在家电3C网购领域,京东是国美在线无法回避的竞争对手,存在直接的市场竞争。虽然跟它有不小差距,既然绕不过去,不如直接挑战。  对比2014和2013相关机构发布的国内B2C电商行业数据,会发现在排名前10的电商平台里,有一家公司格外引人注目,那就是国美在线——市场排名从第十名一下挤进了前五,成为仅次于天猫、京东、苏宁、唯品会之后的第五大电商平台。  笔者认为,国美在线整个2014年的快速发展主要是