论文部分内容阅读
随着经济社会的快速发展和大数据时代的到来,商业情报的获取对于企业科学决策、合理优化产业资源,增强企业的竞争性显得尤为重要。互联网中存在着海量有关工业产品的信息,比如产品发布网站、产品测评网站以及电商类网站等都存在各种类型的工业产品信息,将存在于互联网中的工业产品信息通过构建产品知识图谱进行情报挖掘进而获得商业情报的方法成为主要研究方向。互联网中充斥着大量冗余甚至虚假的信息,要想构建一个高质量的产品知识图谱,关系抽取工作是不可或缺的关键步骤。对于关系抽取工作,现有方法有着很多不足,仍然值得进一步研究与改进。
本文将产品知识图谱应用于商业情报分析与获取中,立足于手机行业,深入研究在知识图谱构建过程中所涉及到的关系抽取关键技术,重点研究了针对文本信息和多模态信息关系抽取方法的改进,本文的工作如下:
(1)针对现有文本信息关系抽取工作中只采用单一词向量模型,无法充分捕捉句子的全部语义信息从而限制了模型总的信息输入量;现有的单一神经网络模型无法更好的综合利用上下文信息和充分把握局部特征的问题,本文提出了一种使用多个词向量模型对同一语料进行映射从而形成多通道的框架;并且每个通道中采用卷积神经网络和双向长短期记忆网络相结合的方法。通过在数据集上与其他模型进行对比,证明了该框架的具有显著的效果。
(2)针对多模态信息关系抽取工作中存在的在图像特征提取过程中随着网络模型深度增加导致的网络退化现象;对多模态信息特征向量直接拼接导致的不能完整且有序的表达多模态信息特征向量的问题,本文提出了针对多模态信息的跨模态关系抽取模型,采用深度卷积神经网络结合残差网络完成对图像信息的特征抽取,然后使用神经网络模型对跨模态的特征向量进行协同表示。通过在数据集上的实验证明,本文提出的跨模态关系抽取模型具有更高的准确率。
(3)本文立足于手机行业,搭建了面向商业情报的产品知识图谱平台,并在产品知识图谱平台上为商业情报分析工具提供了相应接口,通过已经封装好的情报分析方法中心对其进行情报挖掘和分析,得到情报知识库,最后通过情报服务模块进行人机交互,得到对企业有用的商业情报。
本文将产品知识图谱应用于商业情报分析与获取中,立足于手机行业,深入研究在知识图谱构建过程中所涉及到的关系抽取关键技术,重点研究了针对文本信息和多模态信息关系抽取方法的改进,本文的工作如下:
(1)针对现有文本信息关系抽取工作中只采用单一词向量模型,无法充分捕捉句子的全部语义信息从而限制了模型总的信息输入量;现有的单一神经网络模型无法更好的综合利用上下文信息和充分把握局部特征的问题,本文提出了一种使用多个词向量模型对同一语料进行映射从而形成多通道的框架;并且每个通道中采用卷积神经网络和双向长短期记忆网络相结合的方法。通过在数据集上与其他模型进行对比,证明了该框架的具有显著的效果。
(2)针对多模态信息关系抽取工作中存在的在图像特征提取过程中随着网络模型深度增加导致的网络退化现象;对多模态信息特征向量直接拼接导致的不能完整且有序的表达多模态信息特征向量的问题,本文提出了针对多模态信息的跨模态关系抽取模型,采用深度卷积神经网络结合残差网络完成对图像信息的特征抽取,然后使用神经网络模型对跨模态的特征向量进行协同表示。通过在数据集上的实验证明,本文提出的跨模态关系抽取模型具有更高的准确率。
(3)本文立足于手机行业,搭建了面向商业情报的产品知识图谱平台,并在产品知识图谱平台上为商业情报分析工具提供了相应接口,通过已经封装好的情报分析方法中心对其进行情报挖掘和分析,得到情报知识库,最后通过情报服务模块进行人机交互,得到对企业有用的商业情报。