基于本体的多源数据融合方法研究与应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:youshouyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着信息技术的迅猛发展,信息表示形式也日益丰富,互联网中存在着海量数据和有价值的信息。但不同数据信息只能在内部交换,信息交流存在困难。另外,单一数据源无法多方面体现数据特征信息,携带信息属性不全面。将多源数据融合可以对数据信息进行更全面的表示,对信息交流、重用有重大意义。因此,本文从多源数据本体建模、本体相似度计算,融合数据库语义查询三方面对多源数据融合任务展开深入研究,具体工作如下:首先,本文采用本体作为数据表示形式,构建混合本体模型开展数据融合工作,解决传统方法知识获取能力不足,语义表达不明确的问题。在现有本体构建方法的基础上结合领域知识特征,设计出特定领域本体的构建过程,并制定数据库数据到本体数据的匹配规则,完成不同数据到本体数据的映射。其次,本文提出了一种基于图卷积网络的本体相似度计算方法,解决本体映射过程中的相似度计算问题。本体映射是数据融合过程的关键步骤,相似度的计算是本体映射的核心,图卷积网络有效利用不同节点信息,对关系信息保存能力优越。实验结果表明,图卷积网络在本体相似度计算任务表现优于其他模型,取得了最大的皮尔逊系数值,误差最大值、误差平均值、误差标准差是最小的,证明该模型可以高效解决本体相似度计算问题。再次,本文提出了一种基于ERNIE-Bi LSTM-CRF的问句实体识别方法,解决语义查询应用过程中的实体识别问题。该方法通过Bi LSTM模型捕获上下文信息,使用CRF模型对难以表示的强依赖关系进行建模,并利用ERNIE模型对输入问句进行词向量语义增强表示,该模型实体识别能力比基线模型Bi LSTM效果更出色。实验结果表明该模型对电影实体和人员实体有良好的识别能力,与现有方法比较,该方法在准确率、召回率和F值上有着更好的表现,证明融入知识增强语义表示模型有效提升了实体识别能力。最后,基于上述研究设计并实现了面向融合数据的问答系统。用户输入要查询的问句,系统解析问句进行意图识别和实体识别,最后查询融合数据的知识库,返回查询结果。该系统能对多源异构数据进行融合,建立统一的融合数据知识库,并利用融合数据库,进行语义查询工作,有效发挥了数据价值,实现了数据共享和信息交流。
其他文献
多光谱遥感图像有多个谱段,包含地物丰富的光谱信息,每个谱段的图像对应了地物的光谱响应,在数字地图绘制、遥感图像分类等领域中具有重要应用价值。多光谱图像的空间分辨率较低,而全色图像中包含地物丰富的空间细节信息,因此有必要研究多光谱和全色图像融合算法来挖掘多光谱图像和全色图像中的互补信息。目前多光谱图像融合算法依然存在一些问题:1)没有考虑到多光谱图像上采样对图像融合结果的影响。2)融合图像存在空间细
随着科技进步与社会发展,人类社会对于电能的需求不断提高,全球的能源格局正在向着以电为核心的新型能源结构转换。在这之中作为核心发电设备的汽轮机组则起着非常关键的作用,所以针对汽轮机组中核心部件的检修与维护便有着很高的经济效益与社会意义。由于传统的汽轮机叶片检修手段多需要对汽轮机设备进行开缸验修,检修时间长,停机带来的经济损失大,研制一款可以在汽轮机叶片环境中进行探测活动的软体机器人具有很高的经济效益
线性互补问题在流体问题、经济均衡分析等工程领域中发挥着重要作用。在实际应用中,许多线性互补问题都是随时间不断演变的(即时变线性互补问题)。然而长期以来,关于线性互补问题的大部分研究都集中在与时间无关的情形,鲜少有人研究时变线性互补问题,这无疑减小了它在实际生活中的适用范围。因此,如何更快更准确地求解时变线性互补问题变得迫在眉睫。而与此同时,虽然时变线性互补问题能够更自然、更贴切地描述原始问题的物理
永磁同步电机(Permanent magnet synchronous motor,PMSM)具有功率密度高、结构相对简单、效率高等诸多优点,已被广泛应用于航天国防部门、家用电器、工业传动等领域。永磁同步电机驱动系统中的位置传感器可以采用一定精度的增量式光电编码器,不过传感器价格昂贵。目前,采用基于电机物理数学模型的模型法可实现中高速无位置传感器控制,不过在20%额定转速以下时,系统的稳定性和控制
随着科学技术的发展,各类机器人、操作臂的应用越来越加广泛,而且也逐渐推广到工业生产之外的领域。其中,采用关节内置电机的主驱动方式操作臂,因驱动电机及减速传动机构转动惯量的影响,操作臂很难采用被动式驱动操作,实现由手动牵引至工作位置。尤其在国内,该类被动驱动操作臂的相关研究尚属空白。因此,为满足特定领域的应用需求,本文将设计一种能够由操作人员手动牵引,可以在任意位置锁定,随时释放的被动驱动式操作臂。
近年来,随着计算机技术的发展和生物大分子数据的爆发式增长,将数学理论、计算机算法应用到生物学研究当中的趋势越发明显,对机器学习算法预测蛋白质相互作用的研究也在逐年增多。在此背景下,本文研究了机器学习的一个重要分支——神经网络在蛋白质相互作用预测中的应用,并提出了一个预测蛋白质相互作用的新模型——IT-Ens BPNN,并通过实验验证在酿酒酵母数据集和人类数据集上分别达到了93.64%和97.55%
柔性机械臂具有质量轻、负载大、灵活性高、耗能低、操作速度快等特点,具有非常广泛的应用前景。在机械系统中,由于装配制造误差、设计公差、摩擦、磨损及热变形等会使机械系统中机构的几何参数、材料参数、建模过程中所用的模型参数、运动副间隙尺寸等都是不确定的,将不确定参数以区间变量的形式来表示,这些区间变量使实际机构与理想机构的运动发生偏离,降低机械系统的运动精度及运动的稳定性,进而对机械系统的可靠性产生影响
世界上大约80%的电是利用汽轮机所产生,汽轮机一旦发生故障,需要开缸检修,检查时间长,成本高。基于此本文研究一种软体爬行机器人,以期在不开缸状态下进入汽轮机内部探测叶片裂纹情况,从而大幅降低检修成本。本文的主要研究内容如下:主要包括驱动单元扁形弹簧布线方案和力学分析、ABAQUS仿真和实验论证、爬壁机器人结构设计、机器人运动学求解等内容。具体如下:首先,汽轮机叶片的分布形态确定机器人扁平型的身体形
轴承-转子系统故障诊断对于保障航空发动机的安全运行具有重要意义。利用采集到的振动信号的进行故障诊断,是目前最有效的途径,具有准确、方便、快捷等特点。本文以轴承-转子系统振动信号为主要研究对象,针对轴承-转子系统故障特征提取与故障类型识别问题,研究了基于小波变换、Hilbert-Huang变换、稀疏表示的故障特征提取技术,以及基于支持向量机的故障类型识别方法。主要研究内容包括以下几个方面:研究了基于
随着我国快速的快递业务发展,物流快递市场陷入了竞争市场份额的激烈价格战,加盟制的末端网点生存成本高、利润低,亟需良好的网点配送支持。面向将共同配送应用至快件物流的行业趋势,共享网点是由多家末端加盟网点合作组成的网点,通过提供共同的运输配送服务,实现运力运输标准化,从而达到规模经济的效果。针对共享网点面对多快递企业总部的制度要求,当前的网点运力调度不足以应对集合后的大量快件、多中心和复杂时效的业务考