论文部分内容阅读
microRNA(miRNA,微小RNA)是近年来新发现的一类非编码RNA,它在诸多重要生命过程中起着关键的调控作用,人们对其在疾病的诊断和治疗等方面的应用前景寄予厚望。microRNA的研究是涉及计算机技术、生物信息学、智能计算等领域的跨学科前沿方向之一,正引起学者们的广泛关注。本文在分析了有关疾病相关的microRNA文献的基础上,着重探讨了microRNA与疾病的关系,完成了相关的特征数据库管理系统的开发及microRNA的预测方法研究。主要完成的工作如下: 首先,由于研究microRNA与癌症之间的关系需要大量的数据,而这些数据的类型不一、关系复杂,尤其是数据的冗余性、不一致性等问题、不利于后续的研究工作。因此,针对癌症相关的microRNA生物数据,特别是对癌症具有重要调控作用的microRNA进行了研究。在分析有关microRNA与疾病文献资料的基础上,从已有的文献中获得并整理出已知疾病与microRNA关联的信息,例如microRNA名字、基因表现型、疾病类型、microRNA在疾病中的调控作用信息等。 然后,将整理完成后的数据按照一定的格式进行规范化处理,使其必须包含microRNA与疾病的各自的信息以及二者之间存在的关系。为了便于对这些数据进行存储、浏览、查询、提取和分析等,在Visual Studio.NET 2008平台下建立了疾病相关的microRNA特征数据库与查询网站HMMD,并利用疾病相关的microRNA数据库HMMD分析了microRNA对癌症的调控情况。HMMD特征数据库的建立力求为相关研究人员提供一个疾病相关miRNA数据的查询方式,方便后续对癌症等特征数据的研究。 最后,在HMMD数据库收录的数据信息的基础上来预测microRNA。本文通过对microRNA前体pre-miRNA特征向量提取进行改进,建立了训练和测试样本集,并对数据进行了预处理,通过仿真实验建立了pre-predict模型,实验验证结果显示,预测正确率达到了94.3%。