面向数控设备维护的知识图谱构建技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:suyihui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱能够展示信息间的发展和联系,并对隐藏信息进行分析和挖掘,支持智能问答和高效信息检索等应用。制造业是工业的基础,数控技术是横贯现代制造业的关键技术,构建数控设备维护领域的知识图谱是迈向工业智能化坚实的一步。与百科图谱不同,构造面向数控设备维护领域的知识图谱存在着诸多问题,包括实体的多义性、存在复杂的非单一名词性实体类型以及图谱的稀疏性等问题。基于数控设备维护领域的数据特征以及对知识图谱构建的要求,对实体抽取、关系抽取和知识补全技术进行深入的研究。在实体抽取的研究中,提出了一种基于字向量的层叠神经网络。通过字向量模型得到文本融合位置特征的字向量信息,采用高低层网络线性叠加的模型完成数据的序列标注并对错误标注进行更正,通过条件随机场域解决标签依赖问题并对实体进行边界分割。在关系抽取的研究中,提出了一种基于触发词规则和句法依存分析的复合关系抽取模型。模型中构造了适用数控设备维护领域的触发词词典,提出了相应的触发词匹配算法提取关系。句法依存分析首先结合数据特点提取候选三元组和关系特征词,并添加了后处理模块增强模型的抽取性能。为弥补数控设备维护领域中存在的知识稀疏性问题,采用了基于路径查找的知识补全方法推理发现新的关系。该方法采用随机游走算法得到实体间的链接路径,通过游走概率来筛选候选路径。结合卷积神经网络和双向门控循环单元的层叠模型对路径序列进行编码,并引入注意力机制增强重要路径的正向作用,提高了链接预测的精度。实体抽取的实验表明,基于字向量的复合神经网络能够完成数控设备维护领域的实体识别和抽取,性能优于经典的融合随机场域的双向门控循环网络,F1值达到了84.24%;关系抽取模块的实验中,采用的复合抽取模式能够保证较高精度的关系抽取,精确度达到了78.57%;在对知识的补全实验中,基于路径查找的知识补全方法表现出了良好的推理性能,平均精度值达到了0.855。
其他文献
Qemu是一个用C语言编写的开源虚拟化软件,被广泛用于云计算业务以提供虚拟化支持。然而在生产环境中,除了完全组件故障,Qemu还会遭遇传统方法难以检测的局部组件故障。未被妥善应对的完全组件故障,以及由局部组件故障积累转化而导致的系统故障,共同导致了系统可用性的下降。目前,针对上述组件故障问题的诊断方案较少,且多面向Java应用,难以直接迁移到Qemu之上。面向Qemu设计并实现了一套静态离线代码分
学位
随着位置服务应用的风靡,位置服务运营商在收集大量的用户移动数据用于数据分析的同时,也带给用户隐私泄露的风险。为避免这一风险,数据发布方在发布数据前通常会对用户的原始数据进行隐私保护处理。但是扰动后的数据在一定范围内仍然保留了用户的轨迹分布特征和轨迹间相似度,隐私泄露的问题依然存在。发现隐私保护方法中存在的隐私泄露场景,对未来的保护方法的完善具有现实意义。现有的移动数据推理研究中,针对差分隐私保护的
学位
电弧增材制造技术因沉积率高、短周期、高利用率和低成本等优点,具有广泛的应用前景。但在其生产过程中,存在很多干扰因素使零件表面产生缺陷,影响零件的成形精度。在电弧增材制造过程中,检测零件表面缺陷并对缺陷区域进行修补可以提升零件的最终成形质量。基于电弧增材制造点云数据的表面缺陷检测系统可以应用于电弧增材制造的在线监测领域,提高电弧增材制造生产过程的自动化程度和成形零件的精度。首先,将系统的功能模块划分
学位
物理不可克隆函数(Physical Unclonable Function,PUF)是在资源受限设备上实现硬件安全的一种重要解决方案,具有轻量级和唯一性的优势,其结构主要为数字电路PUF。目前攻击PUF的机器学习方法主要包括逻辑回归、可能近似正确、布尔函数等,这些方法大多存在着准确率较低、数据量大的问题。高效机器学习算法的研究主要是提出新的建模攻击方法或者改进当前已有的算法,从以下两方面展开。首先
学位
在脑部CT血管造影成像(Computed Tomography Angiography,CTA)图像中对脑颈动脉供血区域进行分区,对于脑梗死和脑肿瘤等疾病的诊断和治疗非常重要。目前广泛使用人工对脑颈动脉供血区域进行分区的方法,存在对医生专业水平要求高且质量难以控制和效率低的问题。针对人工分区方法的缺点,提出一种全自动的基于CTA图像的脑颈动脉供血分区方法,先使用深度学习网络自动标记出脑颈动脉的不同
学位
随着大数据时代的到来,数据隐私保护问题逐渐成为各方关注重心。安全多方计算技术实现了数据的“可用不可见”,为这一问题提供了解决方案,其中秘密共享技术是其当前实用性最强的技术分支,而隐私保护机器学习是其最热点的研究方向。然而,秘密共享技术仍存在计算效率低下、扩展性不强等限制。最新的CryptGPU方案通过将计算迁移到GPU上提升了计算性能,但其主要关注线性计算的效率提升,而忽略了非线性计算的效率问题,
学位
数字水印作为信息隐藏技术的一个重要分支,在防泄漏溯源、信息防伪、版权保护等方面具有重要作用,得到了广泛的关注和研究。目前基于深度学习的数字水印技术逐渐成为主流,在许多性能指标上都远超传统方法。而Stegastamp模型作为深度学习数字水印模型中的佼佼者,其各方面性能,尤其是鲁棒性,处于领先水平。但是Stegastamp模型仍然存在以下不足:数字水印嵌入痕迹肉眼可见,图像失真严重,并且当数字水印受到
学位
睡眠是人类基本的生理活动,高质量的睡眠为白天高效率地工作、学习、生活提供保障。睡眠分期是评估睡眠质量的技术,同时也是诊断治疗各种睡眠障碍相关疾病的重要依据。传统的人工睡眠分期方法存在高耗时、劳动密集且主观性强的缺陷,随着信号处理技术、机器学习和深度学习方法的发展,睡眠分期任务逐渐向自动化过渡。虽然目前的睡眠分期研究已经在分期准确率、泛化能力等方面取得了不错的成果,但仍存在着睡眠信号数据不纯以及现有
学位
随着神经网络模型规模和复杂度的不断升级,计算开销和内存需求逐渐成为神经网络在资源受限设备上落地的桎梏,因此,模型压缩优化成为了学术界和工业界研究热点。但目前提出的模型压缩算法还存在着严重破坏网络精度、压缩效果不理想及压缩方式单一等问题。针对二值量化离散性导致了二值网络严重的信息丢失上问题,提出了基于残差单元及多阶段梯度近似的二值量化算法。在二值网络的前向传播阶段,基于残差单元的网络结构,将类似的s
学位
中文临床诊断术语实体链接是自然语言处理在医学领域的一个重要应用。在临床上,对于同一个标准术语,由于术语表达多样性以及医生个人书写习惯不同等因素,往往有很多不同的表述。临床术语实体链接就是为了给临床上各种不同的表述找到其在标准知识库中的标准术语。临床术语实体链接系统大体上包括候选术语生成、候选术语重排序和不可链接处理三个阶段。由于中文临床诊断术语数据量大、书写方法不统一等特点,导致中文临床诊断术语实
学位