450K甲基化芯片数据的扩展算法设计与实现

来源 :电子科技大学 | 被引量 : 1次 | 上传用户:1igang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表观遗传学的所有组成中DNA甲基化是最重要的一部分,它在基因转录调控和疾病发生和发展等很多方面具有重要意义。通过实验的办法来检测DNA甲基化水平虽然测得数据较为可信,但是在人力财力上面的花费较大。所以,采用数学计算方法对已测得的DNA甲基化数据进行扩展就显得尤为重要和必要。本文的研究内容是针对450K甲基化芯片数据构建了预测模型,在此基础上进行了在线扩展平台的开发,还借此平台对克罗恩病进行了甲基化研究并得到了比较有意义的结果。本文的主要工作如下:450K芯片数据的预测及扩展研究。450K芯片检测覆盖范围只有2%,无法较为全面的对DNA进行甲基化检测。针对这种情况,本文基于全基因组亚硫酸氢钠测序数据和450K甲基化芯片数据,创造性地利用位点局部甲基化相关性和邻近位点相关性进行特征提取并进行训练,得到了预测模型。该模型具有90%的预测正确率,并且将450K甲基化芯片的检测覆盖范围提高到30%。450K甲基化数据在线扩展平台开发。为了减小甲基化相关研究的时间成本和检测成本,本文基于上述预测模型,开发出了一套基于B/S架构的450K芯片数据在线扩展平台。该平台为用户提供了一个方便和快捷的450K数据在线扩展服务,具有较好的实用性和扩展性。克罗恩病的DNA甲基化研究。本文利用上述模型和平台对正常人和患者样本的450K甲基化数据进行了扩展,并利用假设检验对扩展后的数据进行了差异甲基化分析。结果表明,本文得到的差异甲基化位点、差异甲基化基因和相关通路数量都得到了比较大的提升,而且结合上差异表达数据能够更好的确定了与克罗恩病密切相关的基因和通路,这对于克罗恩病发病机理的研究以及诊断和治疗具有重要意义。综上所述,本文设计了一种具有较高正确率的预测模型来实现对450K甲基化芯片数据的扩展,并在此基础上搭建了具有实用性的在线扩展平台。在克罗恩病的甲基化研究中,本文得到了比较有意义的结果同时也验证了预测模型和平台的有效性。
其他文献
中医院员工以知识型为主,他们的心理期望比较高.心理契约提供了了解和认识雇佣关系以及员工、组织相互责任的独特视角.心理契约具有主观性、内隐性、非正式的特点.中医院构建
目的探讨热塑体膜固定双重标记法在乳腺癌保乳术后调强放疗中应用的临床价值。方法对30例乳腺癌保乳术后调强放疗患者实施不同固定技术,分为A、B两组,每组15例,A组采用常规热
采用水热腐蚀法制备的硅纳米孔柱阵列(Si-NPA),是一种硅的微米/纳米复合结构复合体系,它在微米和纳米两个尺度上形成了三重层次结构,即:由大量微米尺寸的、近似等同的、垂直
分析了我国目前供热管网水力平衡调节方法中存在的一些优缺点,以计算机与单台流量计的计算及测量为手段。提出了一种从理论到实际可操作的室外管网的水力平衡综合调节方法。并
随着我国综合国力的提高,以及社会文明的进步,人们更加渴望具有更加健康的体魄。而良好的运动器械可以增强运动的愉悦感,提升运动品质。采用镁基复合材料作为体育器材的用料
从数控机床能耗角度出发,以切削参数为变量,以降低数控机床能耗为目标,在实际加工经验公式的基础上,考虑机床性能和刀具约束条件,建立数控机床能耗模型,采用粒子群优化算法对
目前,越来越多的高职院校不断扩大招生,纷纷设立了分校区或建设新校区,校区内的基础设施建设也越来越完善,而固定资产数量也随之增加,固定资产的管理工作也成为一项复杂的工
雅典奥运会拥有40亿电视观众,全球最大的转播商美国全国广播公司(NBC)仅广告收入就达10多亿美元。2008年北京奥运会,对中国广播电视业究竟意味着什么?
介绍了ZL205A合金大型环体铸件带状偏析、云雾状偏析、线性偏析及白点偏析的宏观形貌、微观结构及化学成分。带状偏析、云雾状偏析、线性偏析组织的化学成分都是Al2Cu共晶,属