基于多级实体标注与语义增强表示的知识库问答研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:aywjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大规模开放领域的知识库如Freebase、DBpedia和Wikidata等发展迅速,基于知识库的自动问答技术已成为深度学习和自然语言处理领域的研究热点之一。知识库自动问答系统能回答用户的自然语言格式的问题,返回知识库中的答案,满足用户高效智能的搜索需求,提供自然直接的人机交互方式,具有重要的应用价值和研究意义。针对知识库简单问题问答,本文利用深度学习的方法将问句和知识库三元组表示成连续向量,计算问句和三元组的匹配度,包括候选答案生成和评分两个步骤。本文主要工作如下:问答系统根据问句主题实体从知识库中检索生成候选三元组。标注问句主题词是问答系统的第一步,影响着后续步骤的效果。以前的研究通常使用基于词、字符向量和神经网络的方法提取问句主题词,但仅使用词和字符向量无法完整表示问句的语义信息,不能区分歧义词,影响标注结果。本文提出了多级别语义表示的主题实体标注模型,通过问句词、字符嵌入和上下文表示学习问句的多级别语义信息。通过CNN网络学习的上下文的嵌入表示可以捕获到单词的上下文信息,为单词产生不同的向量表示,获得问句更完整的语义表示,也能更好地处理OOV问题。之后通过BiLSTM-CRF模型标注问句主题词。多级别语义表示的主题标注模型在中英文数据集上获得了 91.32%和96.84%准确率。知识库问答系统要求理解自然语言问句和三元组信息以对候选答案评分,仍是一个具有挑战性的问题。大多数方法通过神经网络学习问句和谓语的表示进行答案评分,也有方法学习三元组主语和谓语的语义表示分别与问句进行匹配。但这些方法没有考虑利用知识库包含额外的丰富的知识三元组与结构信息,仅仅使用一个候选三元组,同时没有将三元组视为一个整体。本文提出了基于注意力机制的知识增强的深层语义表示模型,学习问句和三元组整体的语义表示。本文使用知识图谱嵌入学习三元组主语知识表示,并与谓语的语义信息通过注意力机制融合得到三元组的整体表示,捕获三元组知识和语义信息。知识增强的语义表示模型能建模三元组和问句的语义信息,处理问句与三元组的语义鸿沟问题。本文同时也采用动态负采样策略辅助模型训练。本文在SimpleQuestions数据上达到了77.2%的准确度,在NLPCC 2016知识库问答数据集的Average F1值为81.01%,本文提出的模型能得到和其他模型具有竞争力的结果。
其他文献
德国职教六步教学法是我国职业教育改革的主要教学策略之一。农机维修的课程缺乏先进的检查设备,学习条件也较为艰苦。传统的教学方法主要是以教师指导示范-学生被动模仿练习
Spectrum sensing is the fundamental task for Cognitive Radio (CR). To overcome the challenge of high sampling rate in traditional spectral estimation methods, C
期刊
外家家住海南边,垂老频来岂偶然?几个渔舟依海港,两三灶户傍盐田。潮痕每准星长短,水候仍催月次躔。风景苍苍今似昔,可怜华发半盈颠。——明王佐《海边纪行》临高县位于海南
会议
四大名著是中华民族的文化瑰宝,讲述着五千年文明传统中的文人的历史观和人生观,是中华传统文化精髓之所在。《出师表》是《三国演义》中的名篇,其包含深刻的意义,是中国传统
会议
<正>0引言主动声呐回波信号中包含反映目标特性的调制信息[1]。亮点模型将目标回波视为各亮点子回波的叠加,包括几何亮点和弹性亮点[2]。声呐发射LFM信号时回波在时域和频域
会议
In this paper,Symbol-Error-Rate(SER) performance analysis is provided for a Decode-and-Forward(DF) cooperative scheme in satellite mobile channel environment.We
期刊
处理油田高含盐废水COD最常用的方法是生化降解。针对该油田稠油联合站软化处理后水质情况分析,依据现有处理工艺,设计"混凝-活性炭吸附+臭氧催化氧化"工艺处理COD。室内试验
随着新课标的实施,各个学校大力推行全面发展素质教育,中职院校对学生的操作能力和动手能力越来越重视,特别是电子教育课程,更需要培养学生的操作能力。中职电子教师一方面要
本文对城管与其行政相对人管理与被管理之间的矛盾俞显突出、“城管执法难”现象进行了研究,通过现实生活中城市管理执法者遇到的执法困境这一反常现象,提出了东方人耻感文化,自
一年之际在于春,这是养蜂人的共识,如何做好春繁呢?养蜂人都有自己的经验。1.74亿年前被子植物第一花——“南京花”开放(见下图1:左现代花,右南京花化石),蜂、花在适应环境(