基于力导向算法的知识图谱可视化技术研究与实现

来源 :江苏大学 | 被引量 : 0次 | 上传用户:flnlucifer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱以图的形式描述客观世界中实体及其之间的关系,但目前知识图谱的图结构主要用于后台的数据逻辑处理,前端的应用并不是很充分,为此论文将图的可视化技术引入到知识图谱应用系统前端技术中,以提升用户视觉体验,使用户能够更直观、更高效地获取知识图谱的重要节点信息及主要结构特性。图的可视化技术以图中节点和边的合理布局为核心,目前主流的布局模型为基于力学引力和斥力作用的力导向模型,论文以该模型为基础模型,以凸显节点局部聚类特性、反映节点多重隶属关系及提高布局执行效率为目标,开展了两种优化布局算法的研究,并将之应用到慢病知识图谱可视化问答原型系统中。论文的具体研究工作和研究成果如下。(1)基于重叠社区发现的可视化布局优化算法研究。社区包括重叠社区结构,是知识图谱的一种普遍存在,为从整体上反映知识图谱的结构组成,论文基于快速高效的Louvain社区发现算法,利用模糊c-means聚类算法获取节点的隶属度,以此设计模块度函数,实现重叠社区发现功能。同时论文增加社区引力和社区斥力属性改进力导向算法,优化社区布局效果。论文选取能够反映社区划分质量的模块度值、能够衡量布局质量的最小化边缘交叉、最小角度度量等为评估指标,进行了对比实验,结果表明论文所提出的算法的重叠社区检测能力优于CPM算法和COPRA算法,可视化布局结果也较为清晰。(2)基于图嵌入方法的可视化布局优化方法研究。大规模知识图谱常包含高维深层结构,为提高可视化执行效率、并能在有限布局空间内展现核心结构组成,论文基于深度学习图嵌入方法,构建能捕获图深层次的非线性结构、降低节点信息维度的压缩模型,以此提高算法效率。在此基础上,根据提取的图结构,论文设计基于力导向算法的多层迭代方法,优化斥力计算模型,实现布局算法对节点间距离的优化调整。论文选取布局运行时间、最小化边缘交叉作为评估指标,在拥有上万节点的数据集上进行对比实验,结果表明论文所提出方法的算法布局时间为0.336s,具有速度优势,可视化布局效果也得到了改善。(3)基于Echarts的可视化问答原型系统设计与实现。论文使用Echarts框架,集成所提出的两种优化布局算法,设计了慢病知识图谱可视化问答原型系统。论文给出了系统的需求分析、总体设计、数据集获取及主要功能实现,通过功能测试验证了系统设计的可行性和算法的有效性。
其他文献
人的BTF3(basic transcription factor 3)是一个具有双重身份的分子。一方面,BTF3属于新生肽链相关复合体(nascent polypeptide-associated complex,NAC)家族,该家族成员通过防止所结合蛋白的错误折叠来调节蛋白质的合成与降解。另一方面,BTF3也属于通用转录因子家族,可与RNA聚合酶II结合,调控基因转录,在细胞凋亡和增殖等过程中
学位
近年来,移动视频业务在移动互联网业务中所占的比重越来越高,视频流量的爆发式增长给5G移动网络造成了巨大的挑战。为了保证移动用户侧更好的服务质量体验,要求移动网络提供更高的数据传输速率和更低的网络延迟。而现有5G承载网基于TCP/IP架构设计,采取以主机为中心的端到端通信模式,不具备泛在缓存能力,安全性和移动性支持也较差,难以有效支撑5G视频分发业务。为了从根本上解决基于传统5G承载网面向视频分发业
学位
对肿瘤基因表达谱数据集进行数据挖掘获取的有效基因信息对癌症治疗有重要意义。肿瘤基因表达谱数据集属于高维小样本数据集,含有大量冗余信息,难以直接用于分类。很多基于单种群进化算法的基因选择方法可以得到较高质量的基因子集,但在选择过程中仍存在关键基因未被选中,且算法易陷入局部最优的问题。因此,本文基于多群协同进化策略对单目标粒子群优化算法和多目标粒子群优化算法进行改进以实现基因选择,主要工作如下:(1)
学位
随着线上化,无纸化进程的推动,出现了多样的票据种类与应用场景,如医疗清单结算,法院文书记录,保险单核算,文档归档等等。这些票据不再像以往传统发票的统一格式,具有很多极端长宽比的长文本行和单一数字的小文本,它们以密集的形式分布排列。通用的文本检测方法,由于网络的感受野有限,无法充分利用所需的信息来准确预测长文本实例的空间范围;又因为特征提取网络多次卷积下,小文本的空间信息大部分丢失;并且基于分割的方
学位
人参是我国传统名贵中药材,具有增强器官功能、抑制炎症、预防肿瘤及抗病毒等多重功能。中国作为世界上最早开展人参栽培的国家,现今栽培面积和产量位居世界首位,其作用及经济地位不容忽视。由于伐林栽参破坏林区植被系统,严重危及林区生态安全,已被严令禁止,人参种植已向农田栽参模式转移。农田土壤病害严重、有益微生物少、养分失衡等诸多因素限制着人参产业的进一步发展。如何调控土壤微生态系统、促进微生物群落正向演替、
学位
杜鹃花类菌根真菌(Ericoid mycorrhizal fungi,EMF)和深色有隔内生真菌(Dark septate endophyte,DSE)可共定殖于杜鹃花科植物毛根中,可促进植物的养分吸收,但二者的相互作用关系尚不明确。探究两种真菌之间的互作关系,对杜鹃花科植物的生长发育具有重要意义。本研究以笃斯越橘(Vaccinium uliginosum)和红豆越橘(Vaccinium viti
学位
白桦(Betula platyphylla Suk)属于桦木科(Betulaceae)桦木属,落叶乔木。WUS基因作为植物生长信号的主要调节者,对于维持芽尖分生组织中的干细胞生态位、侧基的分化、植物细胞全能性和其他不同的细胞过程是必要的。为进一步研究WUS基因在白桦中的作用,通过生物信息学的方法分析了Bp WUS基因,克隆了Bp WUS基因并构建了Bp WUS-PA7-GFP融合表达载体,通过真空
学位
近年来,冷链产品问题频频发生,不仅损害了产品生产者的形象与信誉,也危害着消费者的身体健康,但传统的冷链溯源系统存在数据易被篡改等问题,无法保证信息的真实性。区块链技术具有去中心化、可追溯和去信任等天然特性,使其在冷链溯源方面有着广阔的发展应用前景。作为区块链技术的核心与重点,共识机制一直制约着区块链技术的实际场景应用,而如何就数据的正确性及一致性达成高效共识成为了区块链技术的突破点之一,共识机制的
学位
从传统汽车向智能网联汽车(Intelligent Connected Vehicles,ICVs)发展的过程中,部署在车内的控制器局域网络由于缺乏足够的防御措施,使ICVs面临的攻击不断增加,且攻击方式具有不确定性和多样性的特点。因此,研究ICVs防护方法,解决恶意攻击带来的信息安全威胁是一项极具挑战性的工作。基于深度学习的入侵检测系统(Deep Learning-based Intrusion
学位
水貂肠炎病毒(mink enteritis virus,MEV)是一种对环境抵抗力较强的单链DNA病毒,给全球水貂养殖业造成了巨大的经济损失。目前,MEV感染靶细胞的机制尚不清晰,使其防控异常困难。明确病毒的感染机制对制定有效的抗病毒策略非常重要。基于量子点的单病毒示踪技术因其可在活细胞中实现病毒粒子成像,目前已成为探究病毒侵入细胞分子机制的实用方法。本研究选取生物素(biotin)-链霉亲和素(
学位