基于多源异构技术的lncRNA与疾病关系的知识图谱构建

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:kvkv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代生物信息学计算方法在lncRNA与疾病关联分析领域的成功应用,在传统生物实验数据的基础上衍生了众多结构相异,来源多样的计算数据,包括结构化的lncRNA调控人类疾病关系数据库数据、基于语义网形式的生物信息链接数据和各式各样以序列化形式存在的多源异构数据。而知识图谱作为一种利用图模型来描述知识和建模世界万物之间的关联关系的技术方法,其发展为从多源异构数据中的知识发现提供了解决方案,基于多源异构数据融合,通过知识挖掘和表示等知识图谱构建技术对多源异构数据进行建模以支持进一步的计算和应用具有重要的研究意义,本文的研究内容分为以下三个部分:(1)提出一种基于多源异构的lncRNA与疾病知识图谱构建方法。该方法分为两层,首先在模式层中,通过领域内已验证的多源知识明确相关术语以及谓语表达方式构建本体库;其次在数据层中,通过资源描述框架对来源不同的异构数据进行同质融合和标准化映射,实现不同结构数据到相同数据结构再到知识的转化,最后以此构建lncRNA与疾病知识图谱。相较于通用知识图谱的构建流程,此方法更能保留相关数据特点,捕获语义信息从而更好地支持知识图谱的下游应用。(2)提出一种基于双层嵌入级联框架lncRNA与疾病知识图谱应用模型。该模型基于知识图谱嵌入和图嵌入的双层嵌入级联框架,首先对融合后的多源异构数据进行关系分类,并分别使用知识嵌入和图嵌入两种嵌入方式获得对应向量化表示,通过两阶段级联的特征选择策略,使特征集在保留图结构拓扑信息的同时保留知识层面的语义信息。论文在第三章的多源异构数据集上开展实验,结果表明该方法在链接预测任务上具有较好的表现,具备挖掘多源异构数据中潜在知识和关系的能力。(3)设计与实现一种lncRNA与疾病知识图谱系统。该系统通过MVC三层系统架构,通过编写相应页面代码和封装数据融合接口以及链接预测功能接口,从知识可视化、链接预测多个项目模块实现lncRNA与疾病关系的知识图谱可视化系统,体现了研究内容的应用价值。
其他文献
宇宙中存在一些稀有星体,这些星体数量稀少但有重要研究价值。在海量天文观测数据中,智能高效地识别稀有星体能更好地辅助天文学家研究宇宙。由于稀有星体数据较少,可识别的特征不多,传统稀有星体识别方法需要人工选择特征,无法实现智能化识别。本文面向稀有星体的数据增强与识别模型进行研究,具体分为以下三个方面:首先,本文对光谱数据与图像数据进行预处理,并提出了一种基于局部连接卷积与生成对抗网络的稀有星体光谱数据
学位
为解决高速移动场景下载波间干扰和符号间干扰对通信系统所带来的问题,Hadani等人提出了正交时频空(Orthogonal Time Frequency Space,OTFS)调制方案,相比于承载在时频域的正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM),承载在时延多普勒(Delay Doppler,DD)域的OTFS具有抵抗时间色散和频
学位
随着密码技术和信息技术的发展,目前的密码算法本身已足够强大,能够对抗传统的密码分析手段,但由于设备本身的工艺特性,其运行时会泄露如功耗、电磁、时间等信息,这些信息能够被攻击者利用从而破解密钥,该方法称为侧信道分析SCA(Side Channel Analysis)。由于侧信道的出现,对加密算法产生了很大破坏性,攻击者利用该方法可以轻松的破解密码芯片的密钥。许多应用加密算法的芯片都容易受到该攻击,其
学位
材料研究的进程不断加快,对材料性能的需求也不仅仅满足于常规条件下。极端条件如高温、强压下材料的性能研究正在成为热点。本文的研究基于密度泛函理论(DFT)的第一性原理,使用计算机软件进行理论模拟计算。分别对间氨基苯甲酸晶体、4-硝基苯乙酸晶体和1,2-双(甲氨基)苯(以下简称2-Bis晶体)进行高压下理论模拟计算,分析三种晶体在高压下晶体结构、电子性质和光学性质的变化,主要研究内容如下:通过分析不同
学位
大规模多输入多输出(Multiple-Input Multiple-Output,MIMO)系统使用的是传统的蜂窝式网络,蜂窝式网络的小区边界会受到干扰,这一直限制着大规模MIMO的性能。去蜂窝大规模MIMO结合了大规模MIMO与分布式天线的特点,在广域上分布大量的接入点(Access Point,AP),并通过时分双工的操作为同一时频资源中的所有用户服务。去蜂窝大规模MIMO引入了“以用户为中心
学位
兵棋推演是一种对实际战争进行仿真、模拟的方法,是研究作战行动的重要工具,也是未来战争的关键环节。在兵棋推演过程中利用规则进行决策的方式缺乏对不同地图以及不同对手的适应能力,若利用强化学习方法可以更好地进行推演过程中的自主学习和智能决策,但是现阶段多智能体领域存在的问题限制了该类方法在兵棋推演中的应用。本文以强化学习方法为基础,针对多智能体领域的置信分配以及稀疏奖励两个问题,分别引入值分解方法与分层
学位
随着互联网的飞速发展,数字产品的消费者可以通过网络频繁地进行数据共享,存在敏感信息可能被用户非法泄漏的隐患,近年来,在数字产品分发系统中,叛徒泄漏明文敏感信息的事件呈现高速增长的趋势,给版权保护带来了巨大的挑战,如何准确且高效地追踪数字产品分发系统中的叛徒成为学术界的研究热点。传统叛徒追踪算法已经无法满足大数据背景下准确且高效地追踪叛徒的需求,而且现有的叛徒追踪算法大多数聚焦于抵抗用户的密钥攻击而
学位
随着物联网的蓬勃发展,它在数据安全性和设备可靠性方面的问题也逐渐暴露出来。区块链技术可以有效解决这些问题,但是巨大的资源消耗和有限的数据处理性能限制了其在物联网场景中的部署。为了解决上述问题,本文对不同区块链系统的性能展开了多维度分析,并进行了针对性的共识机制优化和节点存储优化研究。本文的主要贡献概括如下:(1)为了深入研究物联网场景下的区块链系统性能,提出了一个综合的性能指标集和区块链基准测试工
学位
近年来,电商平台如雨后春笋般大量涌现,人们对网络购物平台的依赖性越来越高,同时平台中的评论文本也呈现出爆发性的增长。这些文本涵盖丰富的情感内容,对商家和其他消费者而言,收集和分析这些数据能给他们带来较高的参考价值。文本情感分析作为自然语言处理(NLP)领域的重要组成部分,一直受到国内外学者的广泛关注。在情感分类任务中,传统的卷积神经网络(CNN)提取的特征具有局限性,往往会忽略词语的上下文信息,而
学位
近年来,由于人们对室内定位的要求日益增加,然而技术方面尚未能实现一个完备的室内定位方案,所以提高室内定位可靠性、提升室内定位准确率成为备受关注的研究点。所以,论文主要针对基于TDOA的室内定位系统展开了探讨研究,以提高室内定位的精度,主要工作如下:(1)室内定位系统的同步模型很大程度上影响了定位性能,因此需要建立一个能真实反映定位系统同步特性的定位模型。论文主要探讨和研究了TDOA的时间同步和定位
学位