基于网络模型的长非编码RNA与蛋白质相互作用预测

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhenmafanwokao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNA(long noncoding RNAs,lnc RNA)在多种生物活动中发挥着重要作用,包括转录、剪接、翻译和细胞凋亡等等。实验表明lnc RNA主要通过与蛋白质的相互作用实现其生物功能,因此研究lnc RNA与蛋白质的相互作用对于探索lnc RNA的作用机制具有重大意义。通过生物实验验证lnc RNA-蛋白质相互作用需要耗费大量的时间和金钱,开发计算模型预测lnc RNA-蛋白质相互作用至关重要。结合当前研究现状,本文基于不同的思路构建两个计算模型预测lnc RNA-蛋白质相互作用。一方面,目前所有的计算方法都需要已知的lnc RNA-蛋白质相互作用作为实验材料,然而已知的lnc RNA-蛋白质相互作用却非常有限。因此本文以微小RNA(micro RNA,mi RNA)作为中介构建lnc RNA-mi RNA-蛋白质异构网络模型,使用间接的lnc RNA-蛋白质相互作用作为实验材料,再结合多种相似度推断可能的lnc RNA-蛋白质相互作用。本方法不依赖于已知的lnc RNA-蛋白质相互作用,在某种程度上可以拓展可预测的相互作用的范围。另一方面,随着测序技术的发展,大量新的lnc RNA和蛋白质被发现,然而当前几乎没有模型可以预测与新的lnc RNA有关的lnc RNA-蛋白质相互作用或者与新的蛋白质有关的lnc RNA-蛋白质相互作用。本文使用相似度核融合算法融合多种lnc RNA和蛋白质相似度,并基于拉普拉斯正则化最小二乘法构建预测模型。该模型不仅可以很好地预测可能的lnc RNA-蛋白质相互作用,同时也可以预测与新的lnc RNA有关的lnc RNA-蛋白质相互作用或者与新的蛋白质有关的lnc RNA-蛋白质相互作用。
其他文献
在卷积神经网络中,密集型的计算会使软件运行速度过慢,很难达到复杂应用的实时响应,因此针对卷积神经网络的硬件加速方案逐渐成为了主流。现有的卷积神经网络已被证明超过90%以上的计算是在卷积层完成的,而且传统卷积层的输入特征图与卷积核乘累加的计算会因加法树的存在而限制并行性,本身的浮点计算量也非常的巨大,严重影响了整个网络的计算时间。因此,针对卷积层的算法改进及硬件加速对整个卷积神经网络的运行效率和性能
学位
视频超分辨率是计算机视觉领域的核心问题之一,主要目的是通过超分辨率方法将低分辨率帧(参考帧)和多个连续帧(相邻帧)恢复成高分辨率视频帧。它是计算机视觉和图像处理中的一个经典且具有挑战性的课题,该方法对于提升早期胶片视频整体的清晰度和像素质量有着重要的意义,其成果在多个领域,例如遥感视频,视频监控,图像医疗和数码摄像等方面有着重要的实用价值。与单图像超分辨率不同的是,视频超分辨率存在帧间的时序信息。
学位
近些年来,随着无线通信技术快速发展,移动互联网向无线端迅速延伸。一方面,通信方式不断增加,覆盖范围持续扩展,业务多样性明显提升,给人们生活带来了显著变化。另一方面,随着社交网络、人工智能、大数据等信息产业的发展,数据信息量的大幅攀升,呈指数增长的人和机器需要实时构建信息网络,对无线网络的需求加速更新。新兴业务对通信服务质量和用户体验等要求的提升,使得传统通信技术难以满足信息量的现实需求。其中的核心
学位
篇章关系识别(Discourse Relation Recognition)旨在理解两个相邻的篇章单元(称为论元)之间的语义连接关系,包括偶然关系、比较关系、扩展关系和时序关系等,其广泛应用于文本摘要、智能问答、机器翻译等自然语言处理领域中。与显式篇章关系不同,隐式篇章关系识别任务由于不能通过连接词直接识别篇章关系,需要结合特定的上下文特征对篇章进行理解,逐渐成为一项极具挑战性的研究任务。目前,隐
学位
近年来,语音合成技术逐渐受到了国内外研究者的广泛关注。在情感语音合成中,如何利用有限的数据进行语音合成模型的训练,以及如何对模型进行改进以适应带有情感风格的非语言韵律特征等问题,依然是目前亟待解决的。对于情感语音合成任务而言,去获取每个说话人的大规模情感语音数据是具有难度和高成本的。所以本研究提出了一种利用情感语音分类任务的中间结果进行迁移学习的方法,该方法能够有效利用低数据资源下的情感语音数据,
学位
深度学习的快速进步促使深度学习算法在计算机视觉、自然语言处理等领域的不断发展,出现了诸如自动驾驶、机器翻译等实际应用系统,不断便利着我们的生活。深度学习依赖于大量标注数据,我们不得不耗费昂贵成本保证其有效工作。但是仍然存在对于少训练样本类别性能下降和无训练样本类别性能近乎为零的问题。为了解决这一问题,使得深度学习系统能够同时识别已见类别和未见类别,学术界提出零样本学习。零样本学习利用已见类别和未见
学位
同时定位与建图(Simultaneous Localization and Mapping,SLAM)在机器人导航、增强现实等应用中具有重要意义,并获得广泛关注与研究。由于视觉传感器具有场景语义信息丰富、成本低廉等优势,视觉SLAM算法在理论研究和实际应用中都得到了快速的发展。现有视觉SLAM算法框架一般可分为视觉前端追踪和后端优化两部分。视觉前端追踪通常采用关键帧思想,对帧与帧之间的相对运动进行
学位
虚假评论识别对于保障消费者和商家的权益以及保证科研数据准确具有重要的意义和价值。目前虚假评论识别主要有两类方法:第一类方法是提取评论文本和评论者相关的统计特征,然后采用传统机器学习模型进行识别;第二类方法是采用深度学习模型提取评论文本语义特征来进行识别。本文在这两类方法的基础上,以Yelp评论数据集为研究对象,构建了一种结合统计特征和文本语义特征的虚假评论识别模型SF-MCLSTM。本文主要的研究
学位
基于图像的人脸重建有着广泛的应用前景,一直是一个重要且具有挑战的问题。尽管现有的基于多图像的人脸重建方法已经取得了可喜的成果,但由于操作设备价格昂贵和图像捕获困难,使得在实际应用中具有很大的局限性。单图像的获取更容易且不需要昂贵的器材,因此探索基于单个输入图像的人脸重建方法尤为重要,但是单图像中如果存在遮挡情况,则无法捕获到被遮挡区域的语义信息。目前解决这一问题的办法有两大类,一类是基于深度学习的
学位
随着公共数据库中生物序列的大量涌现,出现了很多用于预测基因和蛋白质的功能属性的生物信息学算法。预测基因和蛋白质的功能属性过程中的一个挑战是直观地分析和理解生物序列的统计特征。虽然目前已经出现了一些web服务器和独立程序用于生物序列的特征提取以及特征可视化,但是仍然缺乏一个可以完成多种序列特征可视化的软件工具。因此本文完成了一个生物序列特征可视化系统,这是一个开源的跨平台独立程序,它可以通过特征可视
学位