论文部分内容阅读
目的:调查者以往在进行敏感问题调查时,常会因为被调查者的拒绝回答或提供虚假答案而难以获得准确的结果。为了准确了解敏感问题的情况,同时也是为了保护被调查者的隐私,沃纳(Warner)于1965年首先创制了一个二项选择敏感问题的随机化应答模型,提供了对诸如舞弊行为、偷税漏税、吸毒等敏感问题进行调查的方法,将该模型命名为Warner模型。两年后,西蒙斯(Simmons)对Warner模型进行了改进,并形成了Simmons模型。此后,在统计学家们的不断研究下,逐渐形成了敏感问题调查的随机化应答技术(Randomized ResponseTechnique,RRT)。在本课题组研究之前,国内外研究较多的敏感问题类型为属性特征二分类敏感问题和数量特征敏感问题,对于属性特征多分类敏感问题的研究较少;研究较多的统计方法也主要局限于简单随机抽样,实际应用仅局限于小范围内特殊人群的小样本简单随机抽样调查,有的甚至在大规模调查中将复杂抽样调查方法获取的敏感问题资料误用简单随机抽样调查的相关公式来统计分析。另外,关于敏感问题随机应答模型在各种复杂抽样方法下各阶段样本量的估计,也未见报道。而样本量的估计恰恰是抽样设计的关键环节。鉴于此,本文选定了二项选择敏感问题Warner模型、Simmons模型、双无关问题模型、改进的随机应答模型,多项选择敏感问题单一样本随机应答模型以及多项选择敏感问题随机间接回答模型,对这6种RRT模型与二阶段整群抽样方法组合的6种调查方法及其统计公式进行探讨。并在给出敏感问题特征相关统计量计算公式的基础上,当限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出二项选择敏感问题Simmons模型以及多项选择敏感问题单一样本随机应答模型在二阶段整群抽样下估计敏感问题特征总体比例时的最优样本量计算公式,为适用于属性特征敏感问题较大规模调查的复杂抽样方法提供了科学的样本量估计公式;通过对西昌市城区性服务小姐属性特征敏感问题的初步调查分析,为掌握西昌市艾滋病、性病的流行情况提供了参考资料,并估计出样本量计算公式中相关统计量的数值;为科学的估计艾滋病、性病高危人群敏感问题特征提供了科学的调查统计方法,为卫生行政部门制订防控艾滋病、性病的策略、措施提供科学依据。方法:一、对二项选择敏感问题Warner模型、二项选择敏感问题Simmons模型、二项选择敏感问题双无关问题模型和二项选择敏感问题改进的随机应答模型,多项选择敏感问题单一样本随机应答模型、多项选择敏感问题随机间接应答模型6种随机应答模型,与二阶段整群抽样方法组合的共6种调查方法,根据Cochran经典抽样理论、全概率公式等概率论与数理统计学理论方法,给出了敏感问题总体比例的估计量及其方差与估计方差的计算公式。二、分别对二项选择敏感问题Simmons模型以及多项选择敏感问题单一样本随机应答模型下的二阶段整群抽样,在限定抽样误差的大小使调查费用达到最小及限定调查费用的大小使抽样误差达到最小两种情况下,推导出估计属性特征敏感问题总体比例时各阶段的最优样本量计算公式。三、于2011年5月至2011年7月采用二阶段整群抽样方法,在四川省西昌市对城区性服务小姐的7个属性特征敏感问题进行了初步调查,按地理位置和行政区划将西昌市城区分为8个街区,第一阶段随机抽取4个区,第二阶段从被抽中的4个区内平均抽取4个提供有偿性服务的活动场所,抽取所有活动场所中的全部性服务小姐,共计400人;并按本文给出的统计公式,对调查资料作统计分析并估计出样本量计算公式中的有关统计量的数值。四、根据本文推导的敏感问题复杂抽样方法下的样本量计算公式和初步调查得到的相关统计量的数值,对二项选择敏感问题Simmons模型、多项选择敏感问题单一样本随机应答模型共7个敏感问题的二阶段整群抽样,分别计算在限定抽样误差的值使调查费用达到最小时所需各阶段最优样本量和限定调查费用的值使抽样误差达到最小时所需各阶段最优样本量。结果:一、本研究中将抽样技术理论和随机应答技术的理论相结合,推导出二阶段整群抽样方法下二项选择敏感问题Warner模型、二项选择敏感问题Simmons模型、二项选择敏感问题双无关问题模型和二项选择敏感问题改进的随机应答模型,多项选择敏感问题随机间接应答模型等5种RRT模型调查属性特征敏感问题时总体比例的估计量及其方差计算公式。二、运用本文研究的二阶段整群抽样下2种RRT模型的调查方法及其统计公式,调查估计出西昌市城区性服务小姐7个敏感问题结果如下:1.除收费的性服务对象外,西昌市城区性服务小姐拥有配偶或其它固定性伴侣的比例为53.33%、标准误为3.32%。2.西昌市城区性服务小姐被医生诊断患某种性病后停止从事性服务的比例为75.42%,标准误为3.00%。3.西昌市城区性服务小姐同意卖淫合法化的比例为58.75%,标准误为5.20%。4.西昌市城区性服务小姐最近一个月在提供性服务时,从未全程使用安全套、有时全程使用安全套、一直全程使用安全套的比例分别为10.25%、13.37%、76.38%,标准误分别为4.47%、4.00%、7.68%。5.西昌市城区性服务小姐最近一次提供性服务时,安全套有破损的比例为26.88%,标准误为6.00%。6.西昌市城区性服务小姐最近一年从未检查过艾滋病、检查结果阴性、检查结果阳性的比例分别为53.00%、35.00%、5.85%,标准误分别为5.29%、6.24%、3.00%。7.西昌市城区性服务小姐最近一年没有到正规医疗机构检查过性病、检查结果无性病、检查结果有性病的比例分别为68.00%、19.65%、5.75%,标准误分别为4.12%、4.47%、2.45%。三、针对本团队拟于2015年开展的国家自然科学基金项目(编号:81273188)研究中西昌市性服务小姐敏感问题特征的二阶段整群抽样调查,根据本文推导的公式,综合7个敏感问题的初步调查结果,估计出抽样调查各阶段所需样本量。第一阶段需随机抽取的区数n15(个),第二阶段平均每个区需随机抽取的活动场所数n26(个)。结论:本文对属性特征敏感问题6种随机应答模型与二阶段整群抽样方法组合的共6种调查方法,给出了敏感问题特征总体比例的估计量及其估计方差的计算公式,并将其中2种随机应答模型下二阶段整群抽样调查方法成功应用于西昌市城区性服务小姐这一艾滋病高危人群的敏感问题预调查,且取得了较为满意的实际应用效果。说明本文提供的调查方法及其统计公式科学、可靠、有效、实用性强、适用范围广,具有较广阔的应用前景和重要的应用价值。本文还采用了2种随机应答模型二阶段整群抽样调查方法及本文推导的样本量计算公式,对西昌市城区性服务小姐敏感特征调查估计出各阶段所需的最优样本量,具有积极的推广意义和广泛的应用价值。本次预调查结果提示西昌市城区性服务小姐存在同意卖淫合法化比例高、从未到正规医疗机构进行性病与艾滋病检查比例高、性服务时安全套破损比例高等性病、艾滋病高危特征,因此,西昌市的性病、艾滋病防治工作形势仍不容乐观,应引起有关部门的高度重视,进而采取相应的防控措施。