复杂疾病的上位性检测方法研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:tulip126
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着高通量基因分型技术的快速发展,在全基因组范围内对复杂性疾病进行关联研究已成为可能。全基因组关联研究通常以单核苷酸多态性为遗传标记进行病例-对照分析,进而检测出与复杂疾病相关的遗传变异。上位性是指两个或者多个单核苷酸多态性(或基因)之间的相互作用对表型的影响,上位性是影响复杂疾病的重要遗传因素之一。研究人员已经提出了大量方法在全基因组范围内进行上位性检测,但这些方法大多存在效率低、难以处理大规模数据集等问题。本文针对上位性检测方法进行研究,主要包含以下两方面工作:(1)针对现有基于信息熵的上位性检测方法没有考虑数据的非平衡性、效率低等问题,本文提出了一种新的基于信息熵的上位性检测方法Unew。该方法较好地考虑了在非平衡数据集上的应用,同时对条件熵增加了一个惩罚因子,进一步放大了 SNP组合的基因型频率在病例组和对照组之间的差异,从而更有可能把真正与疾病相关联的SNP组合给检测出来。在仿真数据集上的一系列实验表明,该方法提高了检测效率。(2)在全基因组范围内进行上位性检测时,计算量巨大,为此,我们提出了一种新的两阶段法(TwoFC)进行上位性检。该方法把G2检验和APD(Absolute Probability Difference)函数进行融合,得到一个新的打分函数,融合后的打分函数能够更好地衡量SNPs与疾病状态之间的关联强度,从而更可能把与疾病相关的致病SNP组合给检测出来。TwoFC在第一阶段通过融合打分函数筛选出少部分重要候选位点,第二阶段在候选位点中进行上位性检测。在仿真数据集和真实疾病数据集的大量实验表明,TwoFC具有较好的检测效率。
其他文献
此次设计依靠工业设计产品成为消费类电子产品的重要竞争力的大时代,迎合新兴技术的产生与发展,顺应用户在潜移默化中不断改变的切身需求,同时尝试将学习类应用更新迭代的市
随着我国经济的发展,能源已经成为制约经济增长的重要因素之一。而制造业作为能耗大户,具有能耗高、能效低的特点,因此如何合理的降低能耗,提高能源利用效率就成为当前制造业
混合直流异步联网系统综合电网换相换流器高压直流(LCC-HVDC)和电压源型换流器高压直流(VSC-HVDC)各自的优势,提供了一种更为灵活的输电方式,以获得最大的经济和技术效益。然
近年来,大规模集成电路技术飞速发展,以NAND Flash为代表的半导体固态存储器,已经成为各类电子产品中外部存储器的主要选择。其具有大容量、高存储密度、高访问速度、低成本
随着虚拟专用网络(简称VPN)的广泛部署,研究者们针对VPN中隐私保护的特点提出了一种新型的防火墙架构—跨域协作防火墙(简称CDCF)。在2011年的国际会议INFOCOM上,研究者们首
随着经济全球化的发展,很多中国公司与海外公司在国际工程项目上建立了大量业务关系。因此,工程合同作为在双方自愿的基础上明确其权利与义务的正式法律文件,在国际工程项目上的地位与日俱增。工程合同翻译对促进双方工程项目的完成及保护双方利益起着举足轻重的作用。此外,由于工程合同具有合同标的投入大、内容复杂、语言精确严谨的特征,对工程合同翻译要求较高。本篇实践报告选自赞比亚电力公司的088号工程合同中的第二卷
传动链是风力发电机组的重要组成部分,实现从风能到电能的转换。由于其处于变载荷、重载荷和高摩擦的工作环境中,属于机组中故障高发地带,运行和维护成本比较高。温度信号作
伴随着互联网各种应用的兴起,当前信息通信技术、信息通信服务的快速发展以及移动通信和互联网的不断结合,大量新业务不断涌现出来,网络的数据流正在爆发性地增长,用户对于网
网络飞速的发展,新老技术不停的更替,目前整个网络大环境下的网络技术发展方向已经明确,同时现有的网络在服务质量方面被提出了更高的要求,整体网络的更新与发展已是大势所趋
水稻(Oryza sativa)是重要粮食作物,且是单子叶模式植物,研究水稻基因功能对提高作物产量及其他农艺性状意义重大。CRISPR/Cas9是近年来快速发展起来的基因编辑技术,可以实现对