基于多标记学习的长链非编码RNA与疾病关联关系预测方法研究

来源 :山东师范大学 | 被引量 : 0次 | 上传用户:ww5118529
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长链非编码RNA(long noncoding RNAs,lnc RNAs)被定义为长度大于200个核苷酸的非编码RNA。lnc RNAs在早期一直被人们认为是转录噪声,直到最近的研究证明lnc RNAs具有丰富的生物功能,几乎参与所有的生命过程。lnc RNAs的突变和失调与许多疾病相关,在生物体内发挥着重要作用。因此,识别新的与疾病相关的lnc RNAs有助于人类理解lnc RNAs的功能、识别生物标志物和发现药物,并有助于疾病的诊断、治疗、预后和预防。然而,现有的计算方法仍然存在一些问题,例如目前被实验证实的lnc RNAs与疾病之间的关联相对较少,数据集中固有的噪声以及无法对相似性矩阵进行有效融合等,这极大的限制了现有模型的预测精度。因此如何可靠有效地预测特定疾病的相关lnc RNAs仍然是一项具有挑战性的任务。为了解决这些问题,本文主要做了以下研究:(1)提出一种基于鲁棒多标记学习的方法来预测lnc RNAs与疾病的关联关系。首先,算法分别为lnc RNAs和疾病构建一组相似性矩阵,包括疾病语义相似性、lnc RNAs功能相似性、lnc RNAs和疾病的余弦相似性以及高斯相互作用谱核相似性矩阵。随后,算法采用?1范数来自适应地更新整合的lnc RNAs和疾病相似性矩阵,以获得更加清晰的相似性结构。最后,使用基于图的多标记学习框架更新关联矩阵,以揭示lnc RNAs空间和疾病空间之间的潜在一致性。在五个常用数据集上的实验结果表明,本文所提方法在五折交叉验证和留一交叉验证预测中都可以取得很好的效果。前列腺癌的案例分析进一步证实了所提方法在识别lnc RNAs作为潜在预后生物标志物方面的有效性。(2)提出一种基于多视图和多标记学习的方法来预测lnc RNAs与疾病的关联关系。同样地,算法首先为lnc RNAs和疾病构建一组相似矩阵。随后,为了能够更好地挖掘不同相似性视图中的潜在共享信息,算法采用基于全局相似性图引导的多视图模型来获得全局的相似性矩阵。此外,算法利用多标记学习将lnc RNAs空间和疾病空间的关联关系预测整合到统一的框架中。在三个常用数据集上的实验结果表明,本文所提方法在多种交叉验证场景下均能获得良好的预测性能。最后,本文将所提算法应用于宫颈癌相关的lnc RNAs预测,文献挖掘和生存分析均证明了预测结果的合理性。
其他文献
跨模态由文本生成图像是大数据人工智能领域的重要研究课题,其发展推动了跨视觉和语言的多模态学习和推理的研究进程,是近年来最活跃的研究领域之一,在诸多行业有着广泛应用,如艺术生成、游戏引擎和计算机辅助设计等。根据自然语言描述生成与之语义匹配的图像是一个复杂的计算机视觉和机器学习问题,近年来取得了很大的进展。然而,目前大多数由生成对抗网络辅以语义约束的图像生成网络仅提高了图像的视觉真实性和语义一致性,而
学位
目前的医疗影像任务中,磁共振(Magnetic Resonance,MR)图像的获取存在价格昂贵和耗时长的问题,需要借助技术手段获取多对比度MR图像,如今通过深度学习算法研究磁共振图像的合成以提高诊断效率成为一个炙手可热的话题。随着生成对抗网络(GAN)在近年来的图像处理领域中发挥了重要作用,本文主要将结合生成对抗的方法研究不同对比度磁共振图像的合成。现有的一对一MR图像合成方法中,多数只关注图像
学位
科技与信息化发展致使数据存储量呈“爆炸式”发展,为了解决信息过载问题,推荐系统应运而生。如今,推荐系统被广泛应用到各类电子商务领域及线上购物领域,在提高网站商品转化率、用户选择效率及市场公平性等方面具有重要作用。但是由于推荐系统的脆弱性,部分不法分子在利益驱使下对推荐系统进行有目的的攻击,以使得推荐系统的推荐结果产生偏移。因此,为保障推荐系统的推荐质量与用户对推荐系统的信任度,针对攻击环境下的推荐
学位
抑郁症对人类的身心健康造成极大伤害,甚至危害社会。因此,尽早发现抑郁症早期症状并及时治疗极为重要。抑郁症的早期状态称为抑郁倾向。与大多数正常人一样,抑郁倾向患者会在社交媒体平台上分享自己的故事,表达情绪,以及寻求帮助和支持。因此,海量的社交平台数据为我们挖掘抑郁倾向的特征和发现抑郁倾向患者提供了可能。但是,如何更好地利用社交媒体平台数据,挖掘能够识别用户抑郁倾向的重要特征成为一项难题。尽管目前已有
学位
沪港通和深港通是我国证券市场开放的里程碑事件,研究借道沪深股通投资A股的北上资金,对我国资本市场开放进程尤为有意义。本文理论研究与实证研究相结合,将统计检验、事件研究法、线性回归、多因子模型运用于研究北上资金入市特征,及其持仓股票定价的有效性。通过对2014年11月17日以来沪深股通进行指数分析发现,在样本时期内,北上投资者具备择时能力,他们在指数相对较低的区间买入,在指数相对较高的区间卖出,证金
学位
自从人们进入信息化时代以来,互联网一直在潜移默化地影响着人们的日常生活。电子产品在日常生活中随处可见,微博、淘宝等网络平台为人们获取外界信息提供了便利,同时也产生了大量对时事以及产品的评论文本。文本情感分析是挖掘评论文本表达的情感信息,挖掘其中蕴含的情感信息可以为消费者提供决策支持,有助于商家及时获取反馈信息并对产品进行完善升级,同时有助于政府正确引导舆情风向。因此文本情感分析具有巨大的实用价值。
学位
受互联网技术的覆盖以及移动端设备激增的影响,人工智能逐渐渗透到人们商业生活的方方面面。对话系统作为人工智能领域下的重要产物,得益于数据的支持以及深度学习技术的进步,也逐渐向更人性化方面发展。对话系统从特定领域下的任务型逐渐发展到开放领域下的聊天型,从固定规则下的检索型发展为Seq2Seq框架下对话生成型。综合国内外研究现状,基于生成的对话系统能够脱离规则的束缚生成数据库中没有但合理的回答,且模型的
学位
近年来,机械臂的研究一直是国际、国内极其重视的研究热点,在国家政策的大力支持下,目前,由于我国机械臂及智能系统技术正得到飞速发展,工业机械臂、医疗机械臂的应用得到了进一步推广,这极大的促进了我国工业、国防科技事业的大力发展。在机械臂运动过程中,因为各关节和连杆之间的作用力,产生的柔性效应会导致在执行实际任务时精度降低,所以机械臂的柔性特征是需要解决的首要问题。柔性机械臂是一个具有时变、强耦合等特性
学位
当今社会随着互联网的不断发展,学习资源的数量呈指数型上升,种类也多种多样,例如数字图书馆的学习资源、网络课程学习资源等等。在如此多的学习资源面前,用户想要找到最适合自己的学习资源也变得越来越困难,所以如何准确的向用户推荐最适合他的学习资源是一个非常必要的问题。推荐系统是根据用户的需求、兴趣将用户感兴趣的信息(如产品、图书、课程等)推荐给用户的系统。传统的推荐方法在推荐的过程中有很多局限:推荐过程是
学位
情绪的好坏决定着人们的生活状态,快乐、满足和喜悦等积极情绪能够提升幸福感,相反,焦虑、忧愁和厌恶等消极情绪会使人患上精神疾病甚至威胁生命。如何提高情绪分类的准确率并提高在日常生活场景应用的普适性越来越受到研究者的关注。传统的基于生理信号的情绪分类主要通过特征提取和训练分类器进行分类,传统方法的不足之处是准确率低并且可解释性差。Shapelet是时间序列的子序列,它能够出现在时间序列的任何位置,并且
学位