论文部分内容阅读
表观遗传学的所有组成中DNA甲基化是最重要的一部分,它在基因转录调控和疾病发生和发展等很多方面具有重要意义。通过实验的办法来检测DNA甲基化水平虽然测得数据较为可信,但是在人力财力上面的花费较大。所以,采用数学计算方法对已测得的DNA甲基化数据进行扩展就显得尤为重要和必要。本文的研究内容是针对450K甲基化芯片数据构建了预测模型,在此基础上进行了在线扩展平台的开发,还借此平台对克罗恩病进行了甲基化研究并得到了比较有意义的结果。本文的主要工作如下:450K芯片数据的预测及扩展研究。450K芯片检测覆盖范围只有2%,无法较为全面的对DNA进行甲基化检测。针对这种情况,本文基于全基因组亚硫酸氢钠测序数据和450K甲基化芯片数据,创造性地利用位点局部甲基化相关性和邻近位点相关性进行特征提取并进行训练,得到了预测模型。该模型具有90%的预测正确率,并且将450K甲基化芯片的检测覆盖范围提高到30%。450K甲基化数据在线扩展平台开发。为了减小甲基化相关研究的时间成本和检测成本,本文基于上述预测模型,开发出了一套基于B/S架构的450K芯片数据在线扩展平台。该平台为用户提供了一个方便和快捷的450K数据在线扩展服务,具有较好的实用性和扩展性。克罗恩病的DNA甲基化研究。本文利用上述模型和平台对正常人和患者样本的450K甲基化数据进行了扩展,并利用假设检验对扩展后的数据进行了差异甲基化分析。结果表明,本文得到的差异甲基化位点、差异甲基化基因和相关通路数量都得到了比较大的提升,而且结合上差异表达数据能够更好的确定了与克罗恩病密切相关的基因和通路,这对于克罗恩病发病机理的研究以及诊断和治疗具有重要意义。综上所述,本文设计了一种具有较高正确率的预测模型来实现对450K甲基化芯片数据的扩展,并在此基础上搭建了具有实用性的在线扩展平台。在克罗恩病的甲基化研究中,本文得到了比较有意义的结果同时也验证了预测模型和平台的有效性。