基于异构网络数据的lncRNA功能相似性计算方法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:userbyf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
长非编码RNAs(long non-coding RNAs,lncRNAs)是一类长度超过200nt的重要非编码RNA。尽管lncRNAs缺乏直接编码蛋白质的能力,但其展现出的复杂多样的调控功能使其成为解读人类生理活动机制的窗口,这使得lncRNAs功能研究成为当今lncRNAs研究工作的一项重要内容。随着测序技术的飞速发展和生物信息技术不断进步,lncRNAs数量增长迅速。但受生物实验的时间成本和经济成本的限制,目前经实验检验出确切功能的lncRNAs数量仍十分有限。因此,迫切需要建立有效的计算模型来大规模快速预测lncRNAs潜在的调控功能。在生物信息学的研究中,通过计算两个基因之间的相似性,用已知推测未知的方法已被广泛认可,构建功能相似性网络是研究节点之间功能相关性的常用方法。因此,搭建lncRNAs功能相似性网络是推断lncRNAs潜在功能切实可行的方法之一。目前已有一些模型可以计算lncRNAs之间的相似性,但它们共有的一个缺陷就是均是仅考虑了lncRNAs多种调控机制中的一种,难以全方面的表示lncRNAs之间的功能相似性。针对这一问题,本文开发了一个全新的基于整合异构网络数据的lncRNA功能相似性网络模型,构建了能更加准确地描述lncRNA功能相似性的集成网络。该模型首先构建四个单一数据源的异构lncRNA相似性网络:基于miRNAs相互作用的lncRNA相似性网络、基于疾病关联的lncRNA相似性网络、基于GTEx表达谱的lncRNA相似性网络和基于NONCODE表达谱的lncRNA相似性网络。之后,以lncRNA对之间是否具有公共靶m RNAs为标准区分正负样本,计算出每个单一数据源网络ROC曲线的AUC值,作为其相似性权重。对于任一lncRNA对,计算它们在四个网络中加权相似度的平均值,将其作为集成网络中该lncRNA对的功能相似度。该集成网络全面考虑了lncRNAs调控下游靶基因的功能相似性、调节疾病的功能相似性和在器官或组织中差异表达的相似性。对比实验结果表明,集成网络具有更高的lncRNA功能相似性预测精度。为了方便研究人员使用本文的模型,我们构建了名为IHNLnc Sim的在线lncRNA功能相似性分析系统(http://www.lirmed.com/ihnlncsim)。该系统不仅具有计算lncRNA功能相似性数值的基础功能,还可以将计算结果可视化为网络图,便于用户分析结果。IHNLnc Sim还集成了一种基于疾病关联的lncRNA功能富集分析模块,为研究lncRNAs的功能提供了一个方便、高效的分析工具。
其他文献
随着社会的快速发展,生活压力的增大,疲劳成为许多人生活中的一种常态,也成为引起身体疾病和各种事故的重要原因。如何快速有效检测出人体的疲劳状态是保障人体健康的基础,也是防止由疲劳造成损失的重要环节。传统疲劳检测是基于心电(ECG)信号进行的,需长期佩戴电极,难以满足日常疲劳检测的要求。因此,寻找一种简单有效地无束缚疲劳检测方法,成为亟待解决的问题。本研究在分析疲劳检测和心率变异性(HRV)基础上,提
印染废水排放量大,是当前最主要水体污染之一,未经处理的印染废水排放导致的环境问题亟待解决。本文主要围绕石墨相氮化碳改性、协同过碳酸钠方面降解印染废水进行试验研究,以亚甲基蓝(MB)为目标污染物。具体研究内容如下:1.以尿素为前驱体,磷酸氢二胺为磷源,通过热缩聚法、热剥离法制备出磷掺杂石墨相氮化碳纳米片(PS-CN),利用扫描电子显微镜(SEM)、X射线衍射仪(XRD)对样品的表面及结构进行表征。在
在现代公路建设中,由于隧道具有缩短线路里程、提高道路的安全性和可靠性等诸多优点,因此在山岭地区被大量采用。在隧道施工期间,监控量测是一项重要的安全和质量保障工作。研究公路隧道施工期间的围岩变形,对于确保隧道的施工安全意义重大。目前,由于监测仪器的局限性,隧道监测精度通常难以达到相关规范要求;隧道监控量测相关规范中只有变形监测的控制值,没有明确给出不同围岩级别下隧道的变形预警值,不利于隧道施工安全性
在新发展阶段,交通运输部印发了交通强国、数字交通"十四五"发展规划和交通运输领域新基建指导意见等一系列重要文件,旨在指导各省市开展新一轮数字交通规划和建设。本文以广东省为例,通过分析广东区域经济发展格局和"数字政府"改革的新要求,总结"十三五"数字交通建设存在的不足,围绕"数据链"主线,构建全要素、全方式、全周期的数字交通体系,提出新时期数字交通的4大转型原则、321转型策略、7大转型建议,以促进
根据世界卫生组织的数据显示,全球一半以上的国家和地区存在空气污染现象。因此,准确而高效的找出污染源头,达到从根源上治理污染问题的目的具有十分重要的意义。然而,传统的大气污染定位方法大都依赖于气体浓度衰减模型,该模型要求在理想化的环境条件下进行,因此无法避免温度、风速以及大气压强等环境因素对实验的影响。基于此,论文提出一种基于社区分析的大气污染源定位算法(SNA-APSL),为了提高算法对现实污染条
近年来科研学者发现,具有极高能量密度(2600 Wh/kg)和理论比容量(1675m Ah/g)的锂硫电池有望成为下一代能量存储系统之一。但锂硫电池的实际应用仍受到诸多困难的阻碍,其中包含活性物质硫较差的导电性,中间产物多硫化锂(LPS)的穿梭效应以及硫锂化过程的体积膨胀。针对以上问题,本论文从锂硫电池正极载体材料的改性以及夹层材料的设计出发,采用喷雾干燥法,自然沉降法和化学气相沉积法合成多功能沸
互联网时代将人类的思维定势推向了一个的新高度,未来将会有更多机器、技术与用户之间的冲突。在产品设计领域,银发经济的兴起让老年人的需求进入大众视野,面对更新迭代飞速的智能产品时,他们先前的经验及储存的知识不足以流畅操作此类设备。因此,以目标用户需求为中心的交互式产品的易用性研究以及可用性评估是一个重要问题。本课题从老年用户的需求入手,以家用电器产品为研究对象,通过可供性理论的对比分析,提炼可供性在设
青白瓷系的窑场多分布在我国南方一带,在两宋时期,青白瓷是陶瓷烧制工艺的代表,由宋迄元盛烧不衰,元末明初走向没落,慢慢被人们所淡忘,直至20世纪80年代才重新回归到人们的视野之中。青白瓷的制作技艺非常独特,本文拟以宋代顺昌官山窑青白瓷瓜棱壶为例进行解析。
随着机器人技术和自动化水平的提升,工业机器人已成为智能制造领域的核心装备,而定位精度是评价机器人性能好坏的关键指标之一。由于加工制造误差、齿轮齿隙以及运动学参数误差等原因,工业机器人末端会产生定位误差,从而影响工业机器人定位精度的可靠性。相比重复定位精度,工业机器人的绝对定位精度更低,因此提高绝对定位精度更能推动工业机器人的广泛应用。基于Kriging模型,本文提出一种主动学习的可靠性分析方法,经