分类敏感问题RRT模型下分层二阶段整群抽样的统计方法及应用

来源 :苏州大学 | 被引量 : 0次 | 上传用户:asas123456123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目的:目前,国内外艾滋病高危人群敏感性问题调查估计的统计方法研究,主要是方便抽样、自愿者抽样、网络调查、滚雪球抽样等,或将这些抽样方法获得的敏感问题数据资料误用简单随机抽样的统计公式来分析,且忽视样本大小的科学估计。艾滋病高危人群敏感性问题的调查实践需要复杂的抽样调查方法,抽样方案设计是抽样调查的指导纲领和总体思路,样本量的估计是抽样方案设计必不可少的环节。本文分别对分层二阶段整群抽样下6种随机应答模型(Randomized Response Technique, RRT),给出敏感问题特征相关统计量计算公式,推导出估计敏感问题特征总体比例的最优样本大小计算公式。通过对北京市男男性行为人群(men who have sex with men,MSM)敏感问题的初步调查分析,为制定艾滋病防控措施提供初步的科学依据;估计出样本大小计算公式中相关统计量的数值,为本课题组拟于2014年开展的北京市MSM人群敏感问题分层二阶段整群抽样的进一步调查,估计出各层各阶段所需样本量,完成国家自然科学基金项目(编号:81273188)研究中的抽样调查设计;对估计艾滋病高危人群敏感问题的特征提供科学的统计方法,为科学制订艾滋病、性病预控措施提供依据。方法:根据经典抽样理论、应用全概率公式、方差性质等统计学基本理论方法,分别对二分类敏感问题Warner随机应答模型、Simmons随机应答模型、双无关问题应答模型和改进的随机应答模型,多分类敏感问题单一样本随机应答模型、随机间接应答模型与分层二阶段整群抽样方法组合的调查方法,推导出敏感问题的总体比例及其估计方差的计算公式。使用柯西不等式、二元函数条件极值等高等数学和线性代数的方法,在限定抽样误差的值使调查费用达到最小以及在限定调查费用的值使抽样误差达到最小两种情况下,推导出估计敏感问题总体比例时各层各阶段的最优样本量计算公式。于2013年7月至9月对北京市MSM人群进行预调查,对预调查资料进行初步统计分析并估计出样本量计算公式中的相关统计量的数值。计算在限定抽样误差的大小使调查费用达到最小时所需的各层各阶段最优样本量以及在限定调查费用的大小使抽样误差达到最小时所需的各层各阶段最优样本量。结果:一、推导出统计量的计算公式1.对分层二阶段整群抽样的Warner随机应答模型,推导出敏感性问题的总体比例估计量及其方差的计算公式。2.对分层二阶段整群抽样的改进的随机应答模型,推导出敏感性问题的总体比例估计量及其方差的计算公式。3.对分层二阶段整群抽样的单一样本随机应答模型,推导出敏感性问题各类别总体比例估计量及其方差的计算公式。4.对分层二阶段整群抽样的随机间接应答模型,推导出敏感性问题各类别总体比例估计量及其方差的计算公式。二、推导出样本大小的计算公式1.对分层二阶段整群抽样的Warner随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。2.对分层二阶段整群抽样的Simmons随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。3.对分层二阶段整群抽样的改进的随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。4.对分层二阶段整群抽样的双无关问题随机应答模型,分别在限定抽样误差的值使调查费用达到最小以及限定调查费用的值使抽样误差达到最小两种条件下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。5.对分层二阶段整群抽样的单一样本随机应答模型,分别在限定抽样误差使调查费用达到最小以及限定调查费用使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。6.对分层二阶段整群抽样的随机间接应答模型,分别在限定抽样误差使调查费用达到最小以及限定调查费用使抽样误差达到最小两种情况下,推导出估计敏感问题特征总体比例的各层各阶段最优样本量计算公式。三、北京市MSM人群初步调查结果本文采用分层二阶段整群抽样方法,应用Simmons模型和单一样本随机应答模型对北京市MSM人群进行初步调查。调查结果如下:北京市MSM人群最近一次肛交男男性行为全程使用安全套的比例为84.6963%;上月男男性行为中从不全程使用安全套、有时全程使用安全套、每次全程使用安全套、没有肛交的比例分别为10.0277%、27.5991%、51.1208%、14.9054%;男男商业性性行为的次均费用小于200元、200至399元、400至599元、600元以上、无男男商业性行为的比例分别为7.9024%、6.3025%、8.7941%、7.9456%、78.6419%;最近一年HIV病毒检测结果为阳性、阴性、检查过但不知道结果、结果不确定、没有检查过的比例分别为5.8356%、79.0336%、6.8098%、7.1772%、8.8146%;最近一年性病检测结果有性病、无性病、检查过但不知道结果、结果不确定、没有检查过的比例分别为10.0833%、74.9760%、7.8417%、6.6617%、8.1743%;男男性行为的方式为肛交、口交、其他方式的比例分别为70.2608%、19.1676%、17.0062%;安全套使用有破损、无破损、没有使用安全套的比例分别为11.9626%、77.0380%、18.8211%。四、进一步调查的样本大小针对本课题组于2014年开展国家自然科学基金项目(编号:81273188)研究中北京市MSM人群敏感性问题特征的分层二阶段整群抽样开展进一步调查,依据本研究推导的统计公式和初步调查结果,计算出各层各阶段所需的样本量估计值:第一层(15-29岁)需抽取的区(县)数n11=10(个),平均每个区(县)需抽取的男男性行为场所数n21=18(个);第二层(30-49岁)需抽取的区(县)数n12=4(个),平均每个区(县)需抽取的男男性行为场所数n22=12(个)。结论:1.本文分别对4种敏感问题RRT模型下的复杂抽样调查方法,首次从数学上推导出统计量的计算公式;本文分别对6种敏感问题RRT模型下的复杂抽样调查方法,分别在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,首次从数学上推导出最优样本量计算公式。说明本文研究的调查方法及其统计公式具有创新意义和理论价值。2.本文将分层二阶段整群抽样方法分别与Simmons模型、单一样本RRT模型结合调查,并将统计公式成功在北京市性病、艾滋病高危人群—MSM人群的敏感问题预调查分析中得到应用,实际应用效果良好。说明本文研究的调查方法及其统计公式具有实用价值。3.预调查结果显示北京市MSM人群作为性病、艾滋病的高危人群,普遍存在以肛交为其主要性行为方式,没有坚持全程使用安全套的比例较高,HIV阳性率和性病检出率较高等高危行为,近年来我国MSM人群中HIV感染率的逐年增加,应引起政府、卫生部门的高度重视,寻找合理的应对措施,针对MSM进行性病、艾滋病的健康教育和行为干预工作日趋迫切。4.按本文给出的公式和预调查数据,科学估计出国家自然科学基金项目(编号:81273188)研究中在分层二阶段整群抽样下进一步调查北京市MSM人群敏感问题特征所需各层各阶段的样本大小,约需调查MSM对象12492人,远大于初步调查时的样本含量1480人。说明初步调查的抽样误差过大,有必要开展进一步调查。
其他文献
随着知识全球化和网络经济的不断深入,区域经济发展方式已逐步从生产要素驱动模式向创新驱动模式转变,更加强调了知识、信息等创新要素在空间配置效率及创新的重要性。技术创
目的:探讨在胰十二指肠切除术中采用3-0血管缝合线间断缝合法胰肠端侧黏膜吻合与3-0血管缝合线连续缝合法胰肠端侧黏膜吻合与在预防胰漏发生中的作用,通过对两种吻合方式的回顾
清末民初,诞生于西亚、中亚等地的"双泛主义"思潮传入新疆,经新疆境内民族分裂主义势力的改造利用,成为新疆民族分裂主义思想理论基础。"双泛主义"分裂思想在新疆的长期渗透
信息安全是现代通信中人们最为关注的问题。现代通信系统依靠密码体制保障数据的机密性、完整性和真实性。经典的密码体制,如RSA,DES和AES等,依赖其破解的计算复杂度在相当长
酚醛树脂是酚类与醛类在催化剂作用下形成的树脂的总称。它是工业化最早的合成高分子材料。在木材加工领域中酚醛树脂是使用广泛的主要胶种之一,其用量仅次于脲醛树脂。尤其是
随着经济全球化的迅猛发展,世界知名跨国公司纷纷推行本土化的经营战略,以便充分利用当地资源,加快市场进入步伐。可以说,本土化经营已经成为跨国公司实现其全球发展而采取的
目的:研究术前减黄对胰十二指肠切除术手术时间、术中出血量、术后如胰瘘、胆瘘、胃排空延迟等并发症发生率的影响,探索适宜的减黄指标及减黄引流时间。方法:收集2010年1月至201
近年来,频繁的金融危机事件以及金融市场的波动,使得金融监管机构和投资者对金融资产价值大幅下滑的波动尤为敏感.尖峰、厚尾现象的金融资产收益率序列,也使得传统的正态分布
目的观察腰椎后路单节段融合内固定术后>2年邻近节段退变的程度,讨论其影响因素。方法随访2009年4月至2011年5月收治的采用PLIF、TLIF两种术式治疗的退行性腰椎疾病患者的临床
学习语言是为了交流使用,交流的最好手段就是讲话。伴随着中国经济的强势崛起,汉语随之走出国门、迈向世界,国内外的对外汉语教学事业也因此得以迅猛发展。而作为对外汉语三