基于单倍型的关联分析方法

来源 :东北师范大学 | 被引量 : 10次 | 上传用户:jodan2008tw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类基因组计划的完成,不论从数量上还是从质量上,都极大地丰富了人类遗传的数据资源,但也容易使人迷失在这浩如烟海的信息中。统计学,作为一种强有力的数据分析工具,越来越受到人们的重视并在遗传流行病的研究中发挥着不可替代的作用。关联分析主要通过研究遗传标记物与可观测的性状之间的统计相关性,来寻找和定位致病基因,并为我们更好的地理解疾病遗传基础发挥了重要的作用。单倍型,作为一种常见的数据类型,被人们认为含有更多的连锁不平衡(LD)信息,而且与其他方法相比,基于单倍型的关联分析在识别疾病关联上有更大的功效,尤其是病例—对照研究中稀有疾病的情况。但是,对这些单倍型进行建模,其中的稀有单倍型会带来很多的统计问题——大量的参数会使功效减少、效率降低。为了克服这些问题,单倍型聚类是个不错的解决方式。本文着重介绍了在基于单倍型的关联分析中,如何有效地利用位点本身以及位点间的信息来提高检验的功效,其中包括一个参数方法和一个非参数方法。本文首先介绍了基于单倍型聚类来进行关联分析的方法,称之为APEG,通过使用EG距离应用AP算法对单倍型进行有效合理的聚类。新提出的针对单倍型这一特殊数据类型的相似性度量EG距离,能够利用不同位点上以及位点之间的结构信息。通过模拟和真实数据的研究发现,APEG方法要比现存的其他方法在探测单倍型与疾病之间是否相关联方面拥有更大的功效,而且在基因定位上,也能够得到比较精确的估计。然后,我们介绍了基于U—统计量的非参数方法U-EGS,其优点是渐进正态性,而且不需要对样本总体的分布进行假设。U-EGS中引入的新的核函数EGS,是EG距离的一种推广,同样也能利用位点的信息。随后的模拟研究也证实了,在不同的参数下,对不同的疾病模型,使用能够融入位点信息的核函数EGS的U—统计量要比没有利用位点信息的U—统计量在统计功效上拥有更大的优势。
其他文献
采用1997—2011年我国31个省区物流业面板数据建立随机生产边界模型,利用Kumbhakar等(2000)的方法对我国物流业TFP增长率进行测算和分解,分析表明:技术进步因素是我国物流业TFP增
[目的]致病菌引起的感染性疾病是近些年威胁人类健康和造成社会恐慌的主要因素,同时也是造成人类死亡的重要原因。而且,细菌性生物武器正日益受到恐怖组织的普遍重视,多起生物恐
初识中国戏曲表演体系的基本特征胡芝风中国戏曲艺术是一门集文学、歌、舞、雕塑、杂技、美术等艺术因素于一体的高度综合的戏剧艺术。戏曲的歌舞结合,其源流可追溯到一千余年
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
众所周知,每台电脑都有其外围设备,电脑的功能越多,其外围设备也就越多.如今,神通广大的个人电脑可以通过各种接口与其外围设备(如打印机、鼠标、调制解调器、扫描仪、数据采
单核细胞增多性李斯特菌(简称单增李斯特菌,Lm)为重要的食源性病原菌,能引起人的败血症、脑炎、脑膜炎和胃肠炎,虽然发生率不高,但死亡率可达30%。不同来源Lm的致病性差异较大,有些菌
<正> 5.1500元中波红外IRCMOS平接列阵的性能在这一节中,我们给出从一个工作于3μm~5μm波段的1500元平接线列上获得的表征结果。
宋峻(原省人大常委会副主任、本刊编委会顾问)——要突出宣传"依法治国"、"依宪治国"这几年来,在改革开放新形势下,在社会转型时期,意识形态等方面的问题比较多,刊物始终没有
三十年代中期以前,中国现代喜剧笼罩着浓厚的英国喜剧风味.受法国风俗喜剧影响的李健吾的喜剧创作更具民族特色.他的喜剧取材,喜剧运动方式,喜剧抒情等都有别开生面的喜剧魅力.