联想知识网络建模与应用研究

来源 :江南大学 | 被引量 : 0次 | 上传用户:chenwu2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本语义表示是自然语言处理的核心内容,也是文本理解、处理和搜索任务中最基本的工作之一。传统的文本表示方法通常无法充分建模文本的上下文信息,导致文本结构信息缺失、文本语义获取不充分。基于神经网络的方法虽然能获得相对较好的结果,但是其可解释性较差,严重影响了它的应用范围。考虑到知识在人类大脑中通常是以联想记忆的形式存在,论文从人脑联想记忆视角出发深入探究知识体系的内在结构,以探索一种新的文本语义建模技术,并就此展开相应的应用研究。不可解释性已经成为深度神经网络在更广泛应用道路的最大障碍,尤其是在大多数人机交互场景下。启发于人脑神经系统强大的联想计算能力,论文提出了一种新颖的、可解释的名词上下文语义表示模型——联想知识网络模型。该联想知识网络结构由纯粹的、不包含语义标签的联想关系组成。通过分析文本中名词间的近邻联想关系动态生成,同时引入了增量更新和约简重构策略。进一步地,针对文本写作这一智能纠错应用场景,论文研究设计了一种新颖的、可解释方法来实现名词上下文语义连贯性检查,作为文本语义表示模型的实际应用问题。在提出的方法中,首先将从文本语料库中学习得到的联想知识网络作为背景知识网络;然后基于背景知识网络计算待检测文本中名词实体间的多层次上下文联想耦合度特征;最后通过一个可解释的分类模型,如决策树,来实现名词实体的上下文连贯性检查和定位。论文中充分的实验结果表明,上述提出的方法在文本检错任务中可以获得优异的性能,完全达到甚至部分超过最新的基于深度神经网络方法所获得的性能。此外,论文从中文词性标注任务出发,提出了一种基于联想知识网络的中文词性标注方法。在新方法中,首先基于已有的词性标注集构建带属性的联想知识网络;然后将需要进行词性标注的句子放入联想知识网络中进行游走分析以生成多条游走路径;接着,引入路径演化强度概念对游走路径进行强度计算,从而得到最优路径;最后根据最优路径上节点及属性名称得到句子的词性标注结果。实验分析以及对比结果表明了新方法的有效性,为中文词性标注任务提供了新思路。论文所提出的文本语义表示方法在自然可解释性以及增量学习能力方面具有神经网络所不可比拟的优势。为发展可解释的机器学习方法,尤其在文本语义表示建模及其实际应用中提供了一种极具启发性的思路。
其他文献
为什么中国官方在宣传中使用网络亚文化话语的同时,又在打击创造这一表达方式的群体?本文认为使用亚文化话语进行宣传的目的是应对外部负面信息。随着“信息全球化”与“全球信息化”的兴起,政治传播不仅关乎着国内的社会舆论,也与国际宣传和公共外交密切相关。在这样的情况下,国家政治安全的威胁已不再局限于传统意义上的军事入侵等因素,还有由信息化所带来的意识形态冲突与冲击,外来的负面信息不仅会影响国家的国际形象,同
学位
随着中国老龄化进程的不断加快,老年人抑郁正在成为备受关注的议题。作为生命历程中的重要事件,生育行为一方面改变了父母的社会角色,为父母带来一定程度的生育损伤、经济压力以及养育压力;另一方面,“养儿防老”等中华传统观念也预示着子女可以为父母在老年时期提供代际间经济支持、生活照料以及情感交流等,这些因素都会对老年人抑郁的最终表现发生影响。在中国低生育率与老龄化交织的背景下,关注子女结构对老年人抑郁的影响
学位
In 2020,more than 80 million people around the world have been forced to flee their homes and become refugees.The number of war refugees is rapidly increasing as conflicts over power and border issues
学位
The weaponization of cognitive technologies is fueling emergence of the sixth strategic domain of warfare that renders human consciousness into a battlespace.The increasing sophistication of such tech
学位
As the U.S.is among the world’s top emitters of greenhouse gases(GHGs),it is vital to sustained climate change mitigation that successive presidential administrations establish and maintain consistent
学位
Ethnocentric Politics have made it vigorous and potentially so devastating that the execution of ethnicity has become the significant base of numerous problems,conflicts,and revolts in the weak states
学位
The aim of this research is to highlight the active role of Morocco in promoting South-South cooperation in Africa as a new emerging actor.Throughout its history,Morocco has continuously stressed the
学位
随着人工智能的发展,智慧医疗已成为目前炙手可热的智能应用领域,在医学图像处理方面发挥着重要的作用。医学影像成像技术在临床医学领域的不断发展,使得人们对图像的依赖性逐渐增强,对诊断的准确率需求不断提高。因此,医学图像处理技术依然有很大的提高和发展空间。其中图像分割一直是该领域的突破点,尤其是针对脑部核磁共振这类灰度不均、存在部分容积效应、既模糊又复杂的图像,很难获得较高的精度。由于每个人脑内部组织存
学位
极限学习机(ELM)原理是利用一种基于单隐层前馈网络的学习算法,采用随机的方法确定输入层和隐含层之间的权值和偏置,通过分析的方法则可以进一步确定了输出层的权值,ELM克服了存在于基于梯度网络算法上的很多不足,如陷入局部极值、不合适的学习速率、学习速度较慢等,但ELM也存在着过拟合的隐患且单个算法稳定性相对较差。本文对此的研究工作如下:针对上述问题,本文提出了多样性正则化极限学习机的集成模型(DRE
学位
技术可以从一篇或多篇文档集合中得到总结文章主旨信息的简短摘要,并要求在遵循事实的前提下保持一定的流畅性。基于深度学习的自动摘要方法更接近人们总结摘要的思想,但其研究深度还远远不够,有待进一步深化。本文主要研究基于深度学习的单文档生成式自动摘要,并完成以下工作:(1)应用文本主题信息的短文本摘要研究。提出一种基于注意力机制和双向长短记忆神经网络的主题信息增强的自动摘要模型,并导入指针机制以避免OOV
学位