多SNP位点关联及基因互作方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:victinfy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
复杂性状的研究对于改良经济作物农艺性状和品质、提高育种水平,以及助推人类复杂疾病的预防、诊断和治疗等方面具有重要的作用。伴随高通量测序技术的高速发展,大量模式生物的全基因组序列被获取,这为复杂性状的研究提供了良好的机遇。同时,如何准确、高效地从海量基因数据中找到影响复杂性状的易感基因,给研究人员带来了巨大挑战。利用生物信息学方法来挖掘基因和复杂性状之间的关联关系,揭示复杂性状的分子机制和作用机理是当前研究的热点。为此,本文以单核苷酸多态性(single nucleotide polymorphism,SNP)和表型数据为主要研究材料,以micro RNA数据为中间媒介,以生物信息学为研究工具,对多位点关联检测、SNP-miRNA-疾病关联预测、SNP上位效应检测和基因-基因相互作用检测等问题展开了深入研究。主要研究内容包括以下四个方面:(1)针对全基因组关联分析中单位点关联分析方法统计功效较低的问题,基于“少数易感SNP位于少数基因”的生物学假设,提出了一种基于加权稀疏组Lasso(weighted sparse group lasso,WSGL)的多位点关联检测方法。首先,从基因和SNP两个层面,使用稀疏组Lasso方法来选择和性状相关的SNP;其次,为提高模型筛选低频易感SNP的能力,利用SNP的最小等位基因频率(MAF)构造权值调整模型对SNP位点筛选力度。WSGL方法考虑到SNP间和基因间的稀疏关系,使用先验生物知识调整SNP的权值,实验结果表明该方法不仅提高了检测方法的检测功效,也符合生物学意义。(2)针对传统基于机器学习的miRNA-疾病关联预测方法中缺失负例,且通过MISIM数据库得到的miRNA功能相似度可能影响交叉验证结果的问题,提出了一种仅使用正样本和隐特征提取的miRNA-疾病关联预测方法(LFEMDA)。首先,设计了一种基于序列的miRNA功能相似度计算方法,取代了传统的使用miRNA-疾病关系推出的miRNA功能相似度矩阵;其次,为了在算法的迭代优化过程中得到最优解,引入了先验miRNA和疾病知识作为辅助变量;最后,借助miRd SNP数据库,查找SNP-miRNA-疾病的关系,进一步明确miRNA通过SNP作用来影响复杂疾病的作用机理。LFEMDA仅使用正例进行特征提取,避免了传统方法中把未知的miRNA-疾病关系当作反例而引入错误信息。实验结果表明,LEFMDA方法优于其他方法,能够有效地预测miRNA-疾病关系。(3)针对传统SNP上位效应检测方法在纯上位效应模型和不平衡数据集上表现不佳的问题,提出了一种基于置换策略和梯度提升模型的上位效应检测方法(permutation-based gradient boosting machine,p GBM)。首先,使用梯度提升模型在初始数据上训练出原始模型;其次,使用两种不同的置换策略对初始数据进行变换,其中一种策略仅保留数据的主效应,另一种策略保留数据的主效应和上位效应,两种置换策略下实验结果的差值可以衡量SNP对之间的相互作用;最后,为提高模型在不平衡数据集上的检测精度,采用平均AUC差值作为判断两个SNP间相互作用强度的度量指标。实验结果证实了p GBM方法的有效性,尤其对纯上位效应和不平衡数据的检测能力有着很大的提高。(4)针对基于SNP的基因相互作用检测方法中SNP维数灾难和统计功效不高的问题,提出了一种基于基尼不纯度的基因-基因相互作用检测方法。首先,通过两个基因单独作用和共同作用的基尼增益构造一个度量指标;其次,使用度量指标和置换策略得到基因间相互作用的显著性差异p值;最后,根据阈值的大小来判断基因间是否存在相互作用。该方法是一种以基因整体为研究单位的检测方法,不需要参数设定,且能够很好地检测基因间的线性和非线性关系。实验结果表明,该方法能够准确、有效地检测基因-基因相互作用。综上所述,本文围绕复杂性状易感基因的挖掘问题,以SNP和表型数据为主线,从不同角度展开研究,提出了基于加权的稀疏组Lasso的多位点关联检测方法、仅使用正例的miRNA-疾病关联预测方法、基于置换策略和梯度提升模型的SNP上位效应检测方法和以基因为研究单元的基因-基因相互作用检测方法。与其它方法相比,实验结果表明,本文的方法提升了检测的准确性。同时,本文的研究内容对于揭示复杂性状和基因之间的关联关系具有重要的理论意义和潜在应用价值。
其他文献
目的:通过数据挖掘分析导师治疗下肢动脉硬化闭塞症的中药处方特点,提炼出治疗本病的基础核心主方化裁血府逐瘀汤;观察化裁血府逐瘀汤在临床治疗FontaineⅠ-Ⅲ期下肢动脉硬化闭塞症的疗效及安全性;并通过细胞实验初步探讨可能的作用机制,为临床的推广提供理论基础。方法:第一部分:纳入本课题组2010年9月~2020年9月,黑龙江中医药大学附属第一医院周围血管病科住院部及门诊收治的下肢动脉硬化闭塞症患者,
液冷技术可提高散热密度、节能减排、降低数据中心的碳足迹,开展数据中心液冷技术的应用研究具有积极的科学意义。详细介绍了应用于数据中心的不同液冷技术及其冷却液。从冷却温度、节能效率、热回收性能3个方面对近年来国内外数据中心液冷技术的应用研究进展进行了综述,结果表明液冷技术冷却温度高,节能效果明显,具有优秀的热回收性能。指出合理分配使用侧及冷源侧的温差,提高部分负载下液冷系统的节能性,探索冷却温度、节能
为了提升云计算数据中心发展水平,打造规模化、虚拟化和平衡化的节能体系,要从智能转型角度出发,促进云计算项目能获取更加科学的运算成本,实现经济效益和社会效益的双赢。本文从基础运营成本和电力消耗成本2个方面分析了云计算数据中心节能对象,并对关键技术内容展开讨论。伴随着信息化技术的全面发展进步,云计算和新型节能技术受到了广泛关注,如何在发挥云计算数据中心优势的同时减少能源损耗是相关工作落实的关键。
期刊
在船舶运动中,大幅度的横摇运动是一种非常危险的现象,严重影响船舶的稳定性和安全性。此外,还会影响船员的健康,降低船舶的经济效益。因此,如何尽可能减小船舶的横摇运动是一个重要问题。为了减小横摇运动对船舶稳定性的影响,从19世纪开始,学者采用了许多减摇装置,如舱底龙骨、减摇舱、舵稳定器等。在海上过程中,由于船舶运动的复杂性,传统方法难以达到良好的减震效果。由于有源鳍具有自适应性,鲁棒性,简单易实现,因
鼻炎是一种常见的鼻腔炎性疾病,采用药物治疗能够在短期内缓解病症,但难以达到彻底治愈的效果,由于其难根治和易复发等特点,会长期地困扰患者的日常生活。相关流行病学研究表明,过敏性鼻炎影响世界范围内10%~40%的人口,其中我国鼻炎患者约有3亿人,鼻炎发病率已高达37%。鼻炎不仅困扰个人生活学习、精神心理,也增加了家庭经济负担以及社会医疗资源消耗。近年来,随着生活水平和生活质量的提高,人们的健康意
期刊
目的:观察且探讨芪蛭疏通饮(自拟方)治疗下肢动脉硬化闭塞症(Ⅰ、Ⅱ期)的临床疗效,为患者供应新的诊疗手段。方法:将2020年1月到2021年2月我校附属第一医院周围血管病科被确诊下肢动脉硬化闭塞症(Ⅰ、Ⅱ期)的患者。随机分成治疗组与对照组2组,每组24例。治疗组予自拟方芪蛭疏通饮,每日1剂,煎取2袋,早晚餐后温服;对照组予脉管复康片4片,日3次,餐后口服。连续服用4周为一个疗程,对两组患者治疗前后
目的观察鼻三针联合中药治疗小儿过敏性鼻炎肺经伏热证的临床疗效。方法选取2019年4月至2020年4月于温州市人民医院针灸推拿科门诊治疗的74例过敏性鼻炎肺经伏热证患儿,按照随机数字表法分为对照组与治疗组,各37例。对照组给予辛夷清肺饮治疗,治疗组在对照组治疗方法的基础上加用鼻三针治疗,2组均治疗4周后,观察临床疗效、治疗前后临床症状积分及血清炎症因子水平的变化情况。结果治疗组总有效率为83.78%
伴随着人工智能、5G、云计算、物联网等新技术的迅速应用,数据流量激增,IDC市场持续快速发展,需要安置的服务器越来越多,数据中心的数量也越来越多,数据中心的能耗问题成为整个行业的焦点。通常情况下,一个数据中心10年的总拥有成本,场地基础设施的初期投资仅占20%,而超过70%的投资则是能源费用支出,特别是电费支出。电费明细中,非IT设备能耗部分,制冷系统占比最高。数据中心通常会以能源利用率PU
期刊
目的探讨针灸结合穴位贴敷治疗小儿变应性鼻炎(肺经郁热型)的疗效。方法选取本院收治的变应性鼻炎(肺经郁热型)患儿84例,采用随机数字表法将其分为两组各42例,对照组采用穴位贴敷治疗,观察组采用针灸结合穴位贴敷治疗,比较两组患儿治疗前后的临床症状及体征评分、疗效、免疫功能和鼻分泌物嗜酸性粒细胞数(EOS)。结果疗后观察组的观察组流涕评分(0.76±0.27)分、喷嚏评分(0.84±0.25)分、鼻痒评
脊髓型颈椎病(Cervical Spondylotic Myelopathy, CSM)是骨科临床常见的退变性疾患,亦是导致脊髓功能障碍的常见原因之一。脊髓受损后导致肢体感觉、运动功能障碍是本病主要的临床表现[1-2],但临床上也常见到脊髓压迫严重,而临床表现较轻,甚或没有的情况[3];正常人随年龄增长,颈椎退变、骨质增生、椎间盘膨出的数量、严重程度和节段数量均增加,其中5.3%出现脊髓压迫