基于多元网络信息的疾病关联长非编码RNA预测模型研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:yingzi9252
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来,愈来愈多实验结果显示长非编码RNA(lncRNA)在各种各样的生命过程有着重要影响,其功能衰减、变异与许多人类复杂疾病的发生及发展息息相关,因此探索致病lncRNA对人类疾病的诊断、治疗及预后等都有着重要意义。考虑到传统生物实验方法识别疾病潜在相关lncRNA费时费力,研究人员们着手于构造预测模型对潜在的疾病关联lncRNA进行挖掘。本文主要通过从不同数据库中得到的lncRNA、miRNA、疾病等相关生物信息所构建的多元网络对疾病的潜在关联lncRNA进行发掘。文中首先对本课题的背景知识及意义做出阐述,然后介绍本文模型的研究基础,并先后提出了3种基于多元网络信息用于识别疾病潜在相关lncRNA的计算模型,其具体内容如下所示:(1)本文首先构建了一种名为IIRWR的计算模型来预测人类疾病潜在相关lncRNA。IIRWR中提出了疾病群的相关定义,设计了一种方法计算lncRNA节点的相关疾病群权重分数,并将该分数加入了由lncRNA节点形成的游走网络,以此网络进行重启随机游走得出lncRNA节点与疾病节点的潜在关联分数。实验结果表明,模型IIRWR的预测性能较其他模型有着较大幅度的提高。(2)针对IIRWR不能预测孤立节点的局限性,本文接着提出了一种基于关联对特征信息的预测模型FVTLDA来发掘疾病潜在相关lncRNA。FVTLDA结合重启随机游走算法和模型IIRWR中对群的定义,从多元网络中提取了每一对疾病与lncRNA的特征信息,使得模型既避免了对已知的lncRNA-疾病关联信息产生的依赖性,也能运用于对孤立生物节点的预测,解决了模型IIRWR存在的问题。此外,为了避免单一模型带来的局限性,FVTLDA分别结合线性回归、神经网络对特征信息进行数据分析,其对比实验和案例分析结果都展示了该模型的优越性能。(3)考虑到模型FVTLDA手动提取特征信息存在的局限性,本文提出了一种名为CNMCLDA的学习框架自动提取多元网络中的隐含生物特征信息,进而对疾病潜在相关lncRNA进行识别。CNMCLDA采用的是矩阵填充形式,其中包含了两个用来分别提取lncRNA和疾病隐藏特征的卷积神经网络,并设计了5种不同的损失函数同步优化模型参数。特别的,该模型还设计了一种划分负样本的算法以保证正负样本均衡,避免了一些传统模型的局限性,其交叉验证实验结果和案例分析都表明CNMCLDA显著优于现有经典计算模型。最后,本文总结了文中三种预测模型,并对未来的研究计划做出了展望。
其他文献
学位
学位
学位
学位
学位
学位
学位
学位
多目标进化算法(MOEAs)是用来解决现实生活中的多目标优化问题(MOPs)的常用方法。MOEAs能够搜索并提供给决策者(DM)一系列权衡解,并供其选择。传统MOEAs随着优化目标数的增加,优化难度也随之增加。因此研究人员提出了在搜索过程中添加偏好信息的方式,进而使DM可以得到目标空间中感兴趣的部分。该方式在一定程度上可以解决高维中算法的选择压力不够和个体数不足以表达完整的帕累托前沿等问题。针对偏
学位