论文部分内容阅读
随着国民经济的发展,人们对精神文化的需求日益增加,推动了我国影视行业的快速发展。现阶段,我国影视行业作品数量众多、风格迥异、精彩纷呈。但影视作品数量的快速增长却带来了一系列的矛盾,其中尤以用户影视信息的精准需求与网页搜索结果模糊之间的矛盾最为突出。用户搜索影视相关信息主要依赖于影视网页搜索,导致给用户返回的结果不够精确,并且搜索过程不够友好。因此,实现一个科学、有效的智能问答系统为用户提供影视信息精准查询来适应影视行业的快速发展尤为重要。本文构建了信息准确、内容新颖的影视领域知识图谱,提出了影视领域知识问答模型,设计并实现了基于知识图谱的影视知识问答系统。本文的研究工作如下:(1)构建了影视领域知识图谱。通过分析已有的领域本体构建技术,提出了一种适应于影视领域本体的构建方法,构建了面向问答场景的影视领域本体。通过设计并实现网络爬虫系统来获取影视领域知识,利用主流的图数据库存储影视知识,构建了面向应用场景的影视领域知识图谱。(2)提出了影视领域知识问答模型。该模型由问句关键词提取模块、问题分类模块、问题查询模块和人机交互模块构成。在问句关键词提取模块,采用了基于ALBERT-Bi LSTM-CRF的影视问句关键词提取模型,与基线模型相比取得了较好的模型效果。在问题分类模块,通过构建影视问答领域数据集,设计了影视问题分类模板,采用了基于ALBERT-Text CNN的影视问题分类模型并取得了较好的分类效果。在问题查询模块,依据影视问题的分类模板设计Cypher查询映射,利用图数据库Neo4j高效的完成复杂的查询任务。在人机交互模块,从用户的角度出发,确定以Web对话窗口的方式作为交互方式。(3)设计并实现了影视知识问答系统。基于领域驱动设计的经典分层架构模型,提出了适应问答系统的分层架构模型,设计了影视问答系统的整体架构。依据设计实现了基于知识图谱的影视知识问答系统。经测试后,该系统可以有效完成用户的影视知识的问答任务。