差异甲基化位点识别算法的对比研究与优化

来源 :电子科技大学 | 被引量 : 2次 | 上传用户:xiaozhui221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA甲基化是最重要的表观遗传机制之一,在基因表达调控、胚胎发育、X染色体失活、基因印记以及维持染色质结构等生物学过程中发挥着重要的作用,并且与许多疾病的致病过程相关。近年来的大量研究表明,差异甲基化位点与许多疾病有直接关系,特别是癌症。因此,识别差异甲基化位点是解剖疾病病因中最关键和最根本的问题之一。本文对多种癌症进行分析,找到每种癌症对应的差异甲基化位点,为癌症早期诊断提供依据,为此本文做了如下工作:1)针对现有统计假设检验方法只是选出在统计上有显著差异的位点,选出来的位点并不都具有类别区分特性,本文引入了基于机器学习的特征选择方法(Elastic Net正则化)。该方法有效解决了假设检验方法不能同时发现多个位点对癌症的组合作用。2)针对在优化差异甲基化识别算法过程中发现选择出的差异甲基化位点不稳定问题,本文提出了基于Elastic Net正则化的集成特征选择算法。本文选择了 13种癌症数据来分析算法特征选择稳固性,结果发现在两种特征选择算法模型分类性能接近的情况下本文算法在特征选择稳固性评价指标(杰卡德指数)上优于Elastic Net正则化特征选择算法。3)在与现有统计假设检验方法的对比中,本文采用在独立测试集上测试本文算法选择出的差异甲基化位点与FastDMA、RnBeads两种假设检验方法得到的差异甲基化位点的类别区分性能。结果发现,本文算法在独立测试集上正确率高于FastDMA与RnBeads,由此可知本文算法选出的差异甲基化位点的类别区分性能优于两种假设检验方法。4)针对本文选出的差异甲基化位点是否有实际的生物意义,本文采用了对多种癌症做癌症共性分析。本文将癌症共有差异甲基化位点对应到基因上,得到38个共有差异基因,查阅文献发现有23个共有差异基因跟癌症有密切关系。本文进行pathway分析时,发现共有代谢通路有11个,其中9个和癌症有直接关系。这说明本文找到的差异甲基化位点能为生物学家提供有效参考。
其他文献
汽车工业的迅速发展带来了严重的环境污染和能源危机,电动汽车成为解决这两大问题的重要途径。然而,在电池技术未能取得根本突破的情况下,续驶里程的不足已成为制约电动汽车发展
目的:探讨穴位敷贴合天麻钩藤饮加减治疗肝阳上亢型高血压的临床疗效。方法:将64例肝阳上亢型高血压患者随机分为对照组与治疗组,每组32例,对照组给予西药非洛地平治疗,治疗
<正>某护卫艇战士小陈,趁艇靠码头的机会,给未婚妻小王买了双红皮鞋,钉好木盒准备寄走。可到第三天,艇快启航了,鞋还放在桌子上。政委发现了这一"情况",又联想到近日小陈的话
期刊
本论文主要围绕无机碘化物经有机高价碘中间体在有机合成中的应用展开,研究了以无机碘化物如碘化铵为主体的新的催化体系,在不同反应体系下的α-对甲苯磺酰氧基化反应、磺酰
目的:研究颈动脉鞘和椎前筋膜的解剖关系,提高颈椎前路手术中对颈总动脉的安全性。方法:取福尔马林固定的教学用成人尸体标本22具,新鲜尸体6具,显露颈动脉鞘和椎前筋膜,观察
近年,复发性流产发生率日益增多,免疫性因素导致的复发性流产也日益突出,已经引起临床的重视。复发性流产的不良生育现状是育龄期及高龄产妇所面临的严峻问题,所以在中西医两
本文利用柯布—道格拉斯生产函数建立个体经济的就业函数,并利用1981~2007年个体经济发展的数据建立ARMA模型分析我国个体经济的就业与资金、收入等变量的关系,发现其吸纳就业
一、在抗日烽火中诞生1937年7月7日,日本帝国主义制造了卢沟桥事变.发动了全面的侵华战争。中华民族到了生死存亡的紧急关头。全国人民在中国共产党高举的抗日民族统一战线
介绍了我国关于保障中低收入者住房问题的相关政策规定,分析了住房市场与政府干预的关系,论述了廉租房与经济适用房在保障性住房中的作用及改革取向。指出了我国实现保障性住房
《中华人民共和国合同法》第一百一十七条规定,因不可抗力不能履行合同的,根据不可抗力的影响,部分或者全部免除责任,但是法律另有规定的除外。当事人迟延履行后发生不可抗力