特定领域知识共享系统的设计与实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tu309
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网飞速发展的背景下,网络中的知识信息迎来了爆炸式的增长,大量的领域知识分散地隐藏在网络数据中。面对海量的领域知识,想要第一时间从中获得需要的关键信息变得非常困难。由于缺少统一的知识集成管理和可视化分析方式,导致知识的共享率不高,而且无法进行有效的分析和复用。此外,在数据多样化的发展趋势下,人们对于知识的多维度表示需求日益增加,这对知识的共享管理和可视化分析提出了更高的要求。目前已有一些知识平台的可以提供知识管理功能,但是无法对复杂冗余的知识进行有效地集成和融合,并且局限于知识的简单展示,无法提供丰富的展示形式。针对上述问题,本文设计并开发了一款面向领域数据的知识共享可视化系统,系统通过知识抽取、知识融合、知识图谱构建等技术将领域文本中复杂离散的信息组织为结构化知识,通过自动化构建知识库并可视化知识图谱构建过程,实现知识的自动化管理和应用,并从多维度、多层次对知识的语义逻辑和数据关联进行可视化展示。特定领域知识共享系统主要划分为四个模块:知识抽取模块、知识融合模块、知识图谱构建模块、可视化展示模块:(1)针对复杂多样的网络文本中隐含的离散领域知识,知识抽取模块通过依存句法分析匹配预定义的语义范式,对文本中的非结构化文本信息进行抽取并统一组织为结构化的事件多元组形式。(2)针对事件多元组中存在的冗余和冲突问题,知识融合模块采用了基于深度学习的实体对齐和交叉验真技术,保证知识的融合效率和准确性。(3)针对海量数据来源,知识图谱构建模块采用分布式架构进行海量知识存储,通过属性图模型重新对数据进行建模,最终利用查询语句优化算法进行存储查询,实现知识的共享管理。(4)针对知识共享系统中数据呈现方式单一的问题,通过图表、地图等方式优化系统交互效果,引入地图接口绘制含有地理位置信息的元素轨迹,最后采用层次划分算法解决海量数据下知识图谱可视化渲染卡顿的问题。完成系统的设计实现工作后,根据系统的功能性需求和非功能性需求进行了系统测试,特定领域知识共享系统的各项功能模块能够正常工作,达到预期结果。系统通过知识抽取融合技术对领域知识进行抽取并统一表示,通过可视化展示模块对领域知识进行多角度展示,实现领域知识的自动化管理和应用并提供知识共享的能力。
其他文献
肥胖已成为引起全球性关注的慢性疾病,是影响人体健康的主要因素,当前减肥产品多伴有副作用,开发安全有效的天然植物产物用于预防肥胖具有重要意义。本试验以富含黄酮类化合物的洋葱皮水提物为研究对象,通过体外细胞试验和体内小鼠试验研究洋葱皮提取物(Onion peel extract,OPE)抗肥胖作用,通过考察生脂基因表达变化初步研究OPE分子作用机制,主要研究内容和结果如下:(1)以3T3-L1前脂肪细
学位
现场可编程门阵列(FPGA)具有集成度高、逻辑资源丰富、设计灵活、开发成本低等优点,在国防和民用电子系统设计中得到广泛的应用,并将在未来5G技术的发展中占据核心地位。然而支持FPGA的EDA软件目前由国外企业垄断,是严重阻碍我国芯片发展的一个瓶颈。因此,随着国产FPGA芯片的不断推出,充分利用现有的科研成果,研究和开发与之相配套的拥有自主知识产权的支持FPGA的EDA软件迫在眉睫。在此背景下,本文
学位
近年来,随着三维数据采集设备的不断发展,计算机开始以一种新的方式认知与理解世界。由于点云采集设备在对同一物体进行采集时会因为视角、遮挡等问题无法仅通过一次扫描便获得完整的物体信息,需要对物体进行不同视角的扫描,而视角变换会导致同一物体不同部分的数据处于不同的空间坐标系中,因此需要点云配准技术将不同坐标系中的点云映射至同一坐标系中从而实现点云数据之间的对齐。随着深度学习在二维视觉领域所取得的巨大成功
学位
源代码的可靠性是软件系统安全的重点,传统的源代码脆弱性分析技术面临着规则制定困难、检测漏报误报率高的问题,随着大数据对安全的赋能,基于深度学习算法的大规模源代码脆弱性检测方案,能有效提升源代码分析规则生成与匹配的精准度,然而其检测粒度较粗,主要适用于对源代码进行文件或函数级别的分析,难以对复杂结构代码进行语句级别的细粒度分析。最近基于图神经网络的大规模源代码脆弱性检测研究,主要关注复杂结构源代码的
学位
随着“智慧矿山”的大力发展,煤炭企业在开采、运输、供电等生产环节中提高了装备自动化水平和环境监测能力。在此基础上,企业通过矿井钻孔设备获取了大量的矿井数据文件,而在智慧矿山的实践实例中,需要对以文本文件和视频文件为主的矿井数据文件进行更进一步地分析,以便充分利用矿井数据,提高分析矿井数据的能力。对于企业来说,文本文件中能够反映岩层信息的数据主要以曲线形式进行展示和处理,视频文件则以其图像展示岩层特
学位
客服帮助企业处理与客户之间的关系,了解客户的诉求,而客服系统以软件能力支撑客户服务,是企业整体发展的必要环节。在科技高速发展的背景下,互联网企业的主体业务扩展到电商、网约车、娱乐等各个领域。传统客服系统无法同时满足企业里多条产品线的需求,但为每个产品线独立研发客服系统代价太大,且难以让各产品线之间共享客服数据。因此客服系统只有向中台化转型,才能减少开发成本,赋能企业内多条产品线的建设,并最大程度利
学位
随着计算机在人们生活工作中的普及,越来越多的人在使用电子显示屏幕的过程中出现了不同程度的疲劳症状。疲劳的出现不仅会使得作业人员的工作能力下降,当人体在发生疲劳后继续作业,还会引发一系列健康问题。研究发现,近些年来因长时间使用电子设备遭受眼疾的患者数量大幅增加。如何及时且准确的检测作业人员的视觉疲劳状态对于减少人群中相关疾病的发生有着重要的意义。目前的疲劳检测方法存在着如数据种类单一,检测结果易受环
学位
拷贝数变异(Copy number variation,CNV)是基因组中一种重要的结构变异,它通常是基因组变异中最常见的变异。研究表明,基因组CNV区域中是否隐含具有生物意义的基因,与癌细胞的产生和发展有密切联系。因此对CNV进行合理的分析,能够为癌症发生机理研究和靶向精准诊疗提供重要信息和科学依据。准确检测CNV是对其进行合理分析的基础,然而,由于CNV区域长且形式复杂多样,对其准确检测具有极
学位
在现实世界中存在着大量的昂贵有约束的黑盒优化问题,这类问题具有问题无梯度信息、约束条件难处理、真实函数评价数据昂贵的三大难点。数据驱动的进化约束优化分别采用了进化算法、约束处理技术和代理模型逐一应对,已经成为解决这类问题的主要方法。现有的数据驱动的进化约束优化方法在解决昂贵有约束的黑盒优化问题上取得了一定成果,但在解决这类问题上仍遇到了诸多挑战。尤其在较小真实数据量的情况下,算法需要在有限的数据量
学位
不同于传统的图像传感器,动态视觉传感器(Dynamic Vision Sensor,DVS)在成像原理上只有外界光照强度的变化值超过设定的阈值时才会有图像。因为这种特性,使得DVS图像传感器在成像上具有低冗余、高帧率、成像时间短的特点。凭借这些特点,DVS图像传感器在自动驾驶、运动目标检测等领域具有传统图像传感器不具有的优势。本文在课题组设计的DVS传感器的基础上,实现的工作包括系统硬、软件及结构
学位