基于树模型的高阶交互作用启发式算法研究及其应用

来源 :南京医科大学 | 被引量 : 0次 | 上传用户:qing19881215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
得益于基因组学技术、高通量测序技术及生物信息分析技术的迅猛发展,研究人员能够获得海量生物数据对疾病进行深入研究,并在许多领域取得了丰硕成果。然而,对复杂疾病的认识,并未如人们预期那样获得革命性突破,以GWAS研究为例,目前所识别主效应的位点只能解释表型变异的部分遗传度,即遗传性缺失(missing heritability)现象。事实上,复杂疾病的发生发展,是由外在环境暴露因素、内在遗传因素相互影响所致,忽视基因—环境、基因—基因交互作用是导致遗传性缺失的原因之一。对生物组学数据的分析,常涉及数十万变量,是典型的“小样本、高维度”数据,即使是一阶交互作用分析,传统交互作用分析方法受算法复杂度高,多重比较校正力度大的影响,在全组学水平上应用受限,难以使用传统方法进行高阶交互作用分析。近年涌现出一些高阶交互作用分析方法,不同方法各有利弊。本文在树模型基础上,提出新的高阶交互作用分析方法(POINT,Path based highorder interaction detector),将其与两种常用高阶交互作用方法在不同模拟情形下进行比较,讨论方法优缺点,并将POINT应用于肺癌GWAS病例对照数据,进行肺癌发病风险的全基因组高阶交互作用分析。全文结构如下:第Ⅰ部分,介绍POINT法原理和构建过程,并探讨POINT构建过程中的几个关键问题。模拟试验结果表明,FP树阈值越低,树模型深度越深、树数目越多,POINT检测能力越强,同时也意味着POINT消耗时间和识别交互组合数增加,综合考虑,FP树阈值设置为0.5,树深度设置为k+3,树数目与待分析数据集变量数有关,模拟研究中设定变量数为300时,树数目设置为150即达到POINT模型检测能力高点。第Ⅱ部分,比较了POINT、i RF和CINOEDV法在不同情形下的统计学性质,模拟结果显示,有主效应、无交互效应时,POINT和CINOEDV一类错误控制较好,i RF膨胀严重;在所有模拟情形中,POINT高阶交互识别能力最好,CINOEDV次之,i RF高阶交互作用检测能力较弱。第Ⅲ部分,将POINT应用于肺癌GWAS发病风险的高阶交互作用分析,在全组学水平下,发现60个最高3阶的交互组合,其中加性模型组合10个,非加性模型组合50个。第Ⅳ部分总结研究优点和不足,对未来研究作展望。
其他文献
随着5G通信技术的发展,无线通信网络要求在有限的无线资源和恶劣的信道环境下尽可能提供更高的数据速率,同时满足保证高服务质量的要求。无人机由于其高机动性和部署灵活的特点,引起了越来越多的关注。但由于无人机机载资源有限,在执行计算密集型任务时,不仅会由于算力不足导致任务时延过高,还会增加能量消耗降低续航时间,限制了无人机在该领域的应用。本文研究了携边缘计算设备的无人机的任务调度问题,对有关调度算法的思
物联网设备数量呈爆发式增长,在智能家居、智能交通、智能医疗等领域得到了重要的应用,成为我们生活中不可缺少的一部分。但由于许多物联网设备都存在着安全漏洞,而且物联网设备制造商难以及时地为其产品提供适当的安全修补程序,因而伴随着巨大的安全隐患。这些设备容易受到外部黑客攻击造成信息泄露,进而会威胁其接入到网络的安全。解决这个问题的一个有效方法就是检测出连接到网络的可疑物联网设备并对其进行隔离,避免与网关
目的:子痫前期是常见的妊娠期并发症,以妊娠20周后出现的高血压和尿蛋白为特征。母体免疫系统的激活和血管生成失衡参与子痫前期的发生发展。Toll样受体9(TLR9)在先天免疫中占有重要地位。血管内皮生长因子A(VEGFA)和可溶性血管内皮生长因子受体1(sFLT1)分别是重要的促血管生成因子和抗血管生成因子。本研究的目的是探究TLR9是否在母胎界面通过调节VEGFA和sFLT1的表达从而抑制血管生成
导电水凝胶是一种结合电导性与水凝胶多孔吸水特性的新型柔性电极材料,由于其电性能和机械性能的可调性被广泛关注。然而,目前大多导电水凝胶的制备方法是通过电活性填料与绝缘聚合物基质结合方式制备,该方法在获得较好机械灵活性的同时不可避免的影响了其电学性能。基于此,本论文致力于开发兼具高导电性和机械灵活性的导电水凝胶电极材料及探索新型制备工艺,以实现低成本大面积制备高性能、可集成的超级电容器件,从而适应并推
第一部分:妇科多发性原发性恶性肿瘤的临床特点和预后分析目的:本部分的研究拟回顾性、连续性收集单中心妇科多发性原发性恶性肿瘤(multiple primary malignant neoplasms,MPMN)的临床资料并完成随访,从发病年龄、发病部位、间隔时间、FIGO分期、治疗方式及生存时间等方面对其行综合分析,旨在探讨妇科恶性肿瘤相关的MPMN的临床特点和生存预后情况。方法:回顾性、连续性收集
目的膀胱癌(BCa)是泌尿系统最常见的恶性肿瘤之一。既往研究显示,骨髓间充质干细胞(BMSC)来源的外泌体是转移内源性分子的载体,在BCa的发生发展中起着重要作用。本研究旨在探讨含BMSCs来源的外泌体中miR-9-3p在BCa恶性进展中的作用机制。方法第一部分:通过生物信息学分析从基因表达综合数据库(GEO)中筛选出在BCa中差异表达基因(DEGs),并在BCa组织和配对癌旁正常组织中用qRT-
国际上管理自然灾害最为常见和有效的方法是保险机制,地震保险制度的建立和发展有助于提升区域内地震风险保障水平。自汶川地震以来,政府和社会大力呼吁构建地震保险制度,目前,我国地震保险的顶层设计已经出炉,意味着地震保险的发展进入了快车道。然而地震保险的实际市场表现却不尽人意,经营风险高、盈利难导致保险经营者们始终对地震保险保持高度警惕状态,地震保险认知程度低极大程度上限制了有效需求和覆盖率,地震保险市场
随着网络服务终端站点数量的急剧增加、网络服务对于时延要求和安全性能的不断提高、及网络能耗的显著增大等发展趋势,新一代物联网系统面临着一系列新的技术挑战。本学位论文针对第六代移动通信的愿景展望和技术发展导向,紧密围绕着物联网系统的网络接入场景主要研究终端站点无线接入的安全性方案、物联网终端站点的无线充电与无线信息传输、异构物联网的干扰抑制、终端站点计算任务的时延理论分析、以及基于智能反射面的物联网接
本文主要是基于介质波导滤波器开展技术研究。这类滤波器与平面微带滤波器、介质集成波导滤波器相比,具有更高的Q值和功率容量;与金属波导滤波器、加载介质构成的介质谐振波导滤波器相比,具有更小的尺寸,非常便于集成于现代射频与微波电路中。近几年,随着陶瓷介质工艺的不断成熟,介质波导滤波器以其优异的性能被广泛应用于基站、终端等现代无线通信系统中,国内外学者陆续开展了大量的技术研究和相关工程应用。本文主要针对直
锂离子电池(LIBs)具有能量密度高、工作电压高、循环寿命长、自放电低、无记忆效应等特点,被认为是便携式电子设备和电动汽车的理想储能器件。一方面,工业化的石墨负极由于比容量低而无法满足锂离子电池对能量密度日益增长的需求;另一方面,具有高比容量的新型电化学活性材料,如金属氧化物、金属硫化物、硅等,在充放电过程中体积变化较大,导致严重的粉化和容量衰减。因此,具有分级结构的多孔碳电极材料受到了关注和开发