面向商业情报的工业产品关系抽取方法研究

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:jcmmdq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济社会的快速发展和大数据时代的到来,商业情报的获取对于企业科学决策、合理优化产业资源,增强企业的竞争性显得尤为重要。互联网中存在着海量有关工业产品的信息,比如产品发布网站、产品测评网站以及电商类网站等都存在各种类型的工业产品信息,将存在于互联网中的工业产品信息通过构建产品知识图谱进行情报挖掘进而获得商业情报的方法成为主要研究方向。互联网中充斥着大量冗余甚至虚假的信息,要想构建一个高质量的产品知识图谱,关系抽取工作是不可或缺的关键步骤。对于关系抽取工作,现有方法有着很多不足,仍然值得进一步研究与改进。
  本文将产品知识图谱应用于商业情报分析与获取中,立足于手机行业,深入研究在知识图谱构建过程中所涉及到的关系抽取关键技术,重点研究了针对文本信息和多模态信息关系抽取方法的改进,本文的工作如下:
  (1)针对现有文本信息关系抽取工作中只采用单一词向量模型,无法充分捕捉句子的全部语义信息从而限制了模型总的信息输入量;现有的单一神经网络模型无法更好的综合利用上下文信息和充分把握局部特征的问题,本文提出了一种使用多个词向量模型对同一语料进行映射从而形成多通道的框架;并且每个通道中采用卷积神经网络和双向长短期记忆网络相结合的方法。通过在数据集上与其他模型进行对比,证明了该框架的具有显著的效果。
  (2)针对多模态信息关系抽取工作中存在的在图像特征提取过程中随着网络模型深度增加导致的网络退化现象;对多模态信息特征向量直接拼接导致的不能完整且有序的表达多模态信息特征向量的问题,本文提出了针对多模态信息的跨模态关系抽取模型,采用深度卷积神经网络结合残差网络完成对图像信息的特征抽取,然后使用神经网络模型对跨模态的特征向量进行协同表示。通过在数据集上的实验证明,本文提出的跨模态关系抽取模型具有更高的准确率。
  (3)本文立足于手机行业,搭建了面向商业情报的产品知识图谱平台,并在产品知识图谱平台上为商业情报分析工具提供了相应接口,通过已经封装好的情报分析方法中心对其进行情报挖掘和分析,得到情报知识库,最后通过情报服务模块进行人机交互,得到对企业有用的商业情报。
其他文献
蛋白质是生命活动的主要承担者,充分了解其结构和相互作用对于疾病的治疗及新型耐抗性药物的研发具有重要意义。然而已知蛋白质的数量增速极快,通过直接观测的方式确定其三维结构面临着成本过高,速度过慢的问题,因此如何成功预测蛋白质三级结构成为了热门研究方向。本研究创新性运用生成对抗网络(GAN)和双向长短时记忆循环网络(BiLSTM)技术对蛋白质二级结构进行预测,有效发挥了承上启下的关键任务,为解决直接利用
学位
制造业是我国的支柱产业,随着中国制造2025的提出,数字化、网络化、智能化是我国制造业未来发展的基本方针。但随着制造业的快速发展,其设备参数关系复杂、关系相互制约、不易管理人员分析等问题也随之出现,而设备参数的设定又是决定产品质量的重要因素之一,因此参数优化是整个制造过程优化中重要的一部分。而复杂的数据关系可以利用知识图谱来进行梳理,可以让管理人员更加容易的理清其中的关系,因此如何利用知识图谱对参
学位
随着大数据时代的到来,与其关系紧密的人工智能技术得到了跳跃式的发展,文本信息的数量不仅展现出跳跃式的增长趋势,还逐渐显现出多标签、多粒度,高复杂性的特点。为了对文本信息进行更为效率的分类管理,实现文本内容的有效保留和准确过滤,研究者们近年来开始关注于自然语言处理领域中最具有普适性的多标签分类技术。基于深度学习的多标签分类方法能够自动地为文本序列中具有显著意义的信息赋予标签,进而实现对文本数据的高效
学位
随着计算机和多媒体技术的高速发展,网络信息化已然成为社会和经济发展的重要趋势。政府、军事、文教等诸多领域的海量信息都在网络空间中存储、传输和处理。开放的网络环境难以避免的吸引了来自世界各地的各类网络攻击(例如信息截取、信息窃听、数据篡改、数据伪造等)。为了保障网络数据传输的安全性,研究者提出了可逆信息隐藏(Reversible Data Hiding,RDH)算法,发送者通过该算法将秘密信息以肉眼
学位
抑郁症是一种常见且高发的精神障碍疾病,现有的评定过程复杂且相对主观,其有效诊断问题亟待解决。面部活动是人情绪变化的主要外在表现,通过面部特征可以研究抑郁症患者的心理活动和精神状态。抑郁症患者长期受疾病的影响,肢体动作方面临床表现为动作迟缓、身体协调能力下降、反应滞后等特点。本文主要基于面部特征、肢体动作和多模态抑郁症识别展开研究,主要工作为:(1)基于面部特征抑郁症识别。面部特征数据采集自受试者汉
学位
随着大数据时代的来临,越来越多的数据需要被存储和处理,这不仅需要海量的存储设备,还需要计算机拥有强大的数据处理能力,从而高效地完成数据处理任务。在这样的时代背景下,深度学习应运而生,并迅速应用到制造、医学,交通、金融等各个领域。深度学习技术的快速发展以及大规模带标注图像数据集的广泛使用,使得计算机视觉技术在图像处理方面有非常大的突破,尤其是在目标检测领域。计算机视觉中的目标检测任务主要包括两大部分
学位
我们在现实生活中面临的大多数决策和规划问题常常受多个因素影响,这些因素之间有可能相互冲突,但又需要通盘考虑,这就类似于对一个多目标优化问题求解。目前,智能优化算法在解决多目标优化问题方面取得了很大的进展,但仍然存在很多一些不足。例如,多目标优化算法面对一些复杂问题时,会出现过早收敛和解分布不均的情况,对于不同的多目标问题,解决效果常常参差不齐。本文在对多目标优化问题做了大量深入研究的基础上,对多目
目前,心血管疾病已经成为危害人类健康的重大疾病,此类病患数量不断增长。心电图(ECG)是医生诊断该心血管疾病的重要依据,能真实地反映心脏的健康状况。此背景下,医疗资源匮乏与患者数量激增之间的矛盾日益凸显。利用计算机辅助诊断心血管疾病变得尤为重要,因此对于心电图自动分类方法的研究具有很强的现实意义。传统方法大多基于单一心拍的分类,忽略了整条心电图记录中,各心拍之间的局部特征和位置关联特征;现有分类方
学位
当今正处于移动互联和流媒体的时代,每天都会产生海量的数据。种类繁多的大量数据为数据分析工作带来了极大的挑战,如何从多种模态、数据量巨大的数据中挖掘有效信息成为了一个热点“话题”。图像字幕生成技术是一种跨模态分析任务,即数据从图像模态到文本模态的转换。该技术的目标是为图像生成一段能够自然表达该图像的文本,是一种多领域交叉学科的研究问题。本文将从研究背景及意义、国内外研究现状等方面详细介绍图像字幕技术
模式识别是利用数学建模的方法,依据样本数据所显现的特性,自动划分样本类别的方法。模式识别在计算机辅助诊断、图像分割、目标检测等诸多领域取得了广泛的应用。在传统的模式识别方法中一般采用单一模态的特征通过一些机器学习算法对样本进行识别,然而单一模态的特征无法包含样本的所有特性。同时单一模态的数据在获取过程中由于环境的影响或传输的原因往往会存在不确定性或者数据缺失的现象。数据的不确定性和数据缺失会给模式
学位