论文部分内容阅读
目的:目前,国内外艾滋病高危人群敏感性问题调查估计的统计方法研究,主要是方便抽样、自愿者抽样、网络调查、滚雪球抽样等,或将这些抽样方法获得的敏感问题数据资料误用简单随机抽样的统计公式来分析,且忽视样本大小的科学估计。艾滋病高危人群敏感性问题的调查实践需要复杂的抽样调查方法,抽样方案设计是抽样调查的指导纲领和总体思路,样本量的估计是抽样方案设计必不可少的环节。本文分别对分层二阶段整群抽样下6种随机应答模型(Randomized Response Technique, RRT),给出敏感问题特征相关统计量计算公式,推导出估计敏感问题特征总体比例的最优样本大小计算公式。通过对北京市男男性行为人群(men who have sex with men,MSM)敏感问题的初步调查分析,为制定艾滋病防控措施提供初步的科学依据;估计出样本大小计算公式中相关统计量的数值,为本课题组拟于2014年开展的北京市MSM人群敏感问题分层二阶段整群抽样的进一步调查,估计出各层各阶段所需样本量,完成国家自然科学基金项目(编号:81273188)研究中的抽样调查设计;对估计艾滋病高危人群敏感问题的特征提供科学的统计方法,为科学制订艾滋病、性病预控措施提供依据。方法:根据经典抽样理论、应用全概率公式、方差性质等统计学基本理论方法,分别对二分类敏感问题Warner随机应答模型、Simmons随机应答模型、双无关问题应答模型和改进的随机应答模型,多分类敏感问题单一样本随机应答模型、随机间接应答模型与分层二阶段整群抽样方法组合的调查方法,推导出敏感问题的总体比例及其估计方差的计算公式。使用柯西不等式、二元函数条件极值等高等数学和线性代数的方法,在限定抽样误差的值使调查费用达到最小以及在限定调查费用的值使抽样误差达到最小两种情况下,推导出估计敏感问题总体比例时各层各阶段的最优样本量计算公式。于2013年7月至9月对北京市MSM人群进行预调查,对预调查资料进行初步统计分析并估计出样本量计算公式中的相关统计量的数值。计算在限定抽样误差的大小使调查费用达到最小时所需的各层各阶段最优样本量以及在限定调查费用的大小使抽样误差达到最小时所需的各层各阶段最优样本量。结果:一、推导出统计量的计算公式1.对分层二阶段整群抽样的Warner随机应答模型,推导出敏感性问题的总体比例估计量及其方差的计算公式。2.对分层二阶段整群抽样的改进的随机应答模型,推导出敏感性问题的总体比例估计量及其方差的计算公式。3.对分层二阶段整群抽样的单一样本随机应答模型,推导出敏感性问题各类别总体比例估计量及其方差的计算公式。4.对分层二阶段整群抽样的随机间接应答模型,推导出敏感性问题各类别总体比例估计量及其方差的计算公式。二、推导出样本大小的计算公式1.对分层二阶段整群抽样的Warner随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。2.对分层二阶段整群抽样的Simmons随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。3.对分层二阶段整群抽样的改进的随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。4.对分层二阶段整群抽样的双无关问题随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。5.对分层二阶段整群抽样的单一样本随机应答模型,分别在限定抽样误差使调查费用达到最小以及限定调查费用使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。6.对分层二阶段整群抽样的随机间接应答模型,分别在限定抽样误差使调查费用达到最小以及限定调查费用使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。三、北京市MSM人群初步调查结果本文采用分层二阶段整群抽样方法,应用Simmons模型和单一样本随机应答模型对北京市MSM人群进行初步调查。调查结果如下:北京市MSM人群最近一次肛交男男性行为全程使用安全套的比例为84.6963%;上月男男性行为中从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的比例分别为10.0277%、27.5991%、51.1208%、14.9054%;男男商业性性行为的次均费用小于200元、200至399元、400至599元、600元以上、无男男商业性行为的比例分别为7.9024%、6.3025%、8.7941%、7.9456%、78.6419%;最近一年HIV病毒检测结果为阳性、阴性、检查过但不知道结果、结果不确定、没有检查过的比例分别为5.8356%、79.0336%、6.8098%、7.1772%、8.8146%;最近一年性病检测结果有性病、无性病、检查过但不知道结果、结果不确定、没有检查过的比例分别为10.0833%、74.9760%、7.8417%、6.6617%、8.1743%;男男性行为的方式为肛交、口交、其他方式的比例分别为70.2608%、19.1676%、17.0062%;安全套使用有破损、无破损、没有使用安全套的比例分别为11.9626%、77.0380%、18.8211%。四、进一步调查的样本大小针对本课题组于2014年开展国家自然科学基金项目(编号:81273188)研究中北京市MSM人群敏感性问题特征的分层二阶段整群抽样开展进一步调查,依据本研究推导的统计公式和初步调查结果,计算出各层各阶段所需的样本量估计值:第一层(15-29岁)需抽取的区(县)数n11=10(个),平均每个区(县)需抽取的男男性行为场所数n21=18(个);第二层(30-49岁)需抽取的区(县)数n12=4(个),平均每个区(县)需抽取的男男性行为场所数n22=12(个)。结论:1.本文分别对4种敏感问题RRT模型下的复杂抽样调查方法,首次从数学上推导出统计量的计算公式;本文分别对6种敏感问题RRT模型下的复杂抽样调查方法,分别在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,首次从数学上推导出最优样本量计算公式。说明本文研究的调查方法及其统计公式具有创新意义和理论价值。2.本文将分层二阶段整群抽样方法分别与Simmons模型、单一样本RRT模型结合调查,并将统计公式成功在北京市性病、艾滋病高危人群—MSM人群的敏感问题预调查分析中得到应用,实际应用效果良好。说明本文研究的调查方法及其统计公式具有实用价值。3.预调查结果显示北京市MSM人群作为性病、艾滋病的高危人群,普遍存在以肛交为其主要性行为方式,没有坚持全程使用安全套的比例较高,HIV阳性率和性病检出率较高等高危行为,近年来我国MSM人群中HIV感染率的逐年增加,应引起政府、卫生部门的高度重视,寻找合理的应对措施,针对MSM进行性病、艾滋病的健康教育和行为干预工作日趋迫切。4.按本文给出的公式和预调查数据,科学估计出国家自然科学基金项目(编号:81273188)研究中在分层二阶段整群抽样下进一步调查北京市MSM人群敏感问题特征所需各层各阶段的样本大小,约需调查MSM对象12492人,远大于初步调查时的样本含量1480人。说明初步调查的抽样误差过大,有必要开展进一步调查。