基于知识图谱的观点检索

来源 :福州大学 | 被引量 : 0次 | 上传用户:mint_z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,越来越多的用户交互式媒体涌现出来,人们在这些平台上发表对事物的观点评论,对这些观点文档的研究蕴含了巨大的商业价值和学术价值。随着数据量的不断增大,观点检索也逐渐成为自然语言处理的一个研究热点,它研究如何从社交媒体等文档集中找出带有观点的相关文档,既要求检索出的文档与给定主题相关,还要求带有对主题的评论或看法。目前,国内外学者对观点检索已经开展了许多研究,并取得了一定的成果。但由于用户查询时输入通常很短,难以准确表示查询的信息需求,而现有方法往往忽略了这一点。针对该问题,本文利用知识图谱理解用户的信息需求,进行了以下三个方面的工作:(1)针对用户查询通常很短,难以准确表示查询的信息需求的问题,提出了基于知识图谱实体文本的观点检索模型,通过知识图谱中的实体文本理解用户的信息需求。该模型首先由知识图谱获取候选查询扩展词,并计算每个候选词的扩展词分布、共现频率、邻近关系、文档集频率等特征,然后利用4类特征通过SVM分类得到扩展词,最后利用扩展词对产生式观点检索模型进行扩展,实现对查询的观点检索。实验表明,在微博和推特两个数据集上,与基准工作对比,所提出的方法在MAP、NDCG等评价指标上均有显著的提升。(2)针对基于知识图谱实体文本的观点检索模型中只利用了实体文本的特征,而知识图谱中的其他信息并未得到充分利用的问题,提出了融入知识图谱实体类别的观点检索模型。首先将用户查询和文档实体链接到DBpedia,获取实体的类别属性,然后根据类BM25公式计算实体类别评分,并将类别评分与原有的主题相关度评分进行融合,得到新的检索模型公式。在中英文数据集上的实验结果表明,该模型的检索效果在多个评价指标上均好于(1)中提出的方法。(3)针对融入实体类别的观点检索模型只考虑了单个实体的描述文本和类别属性,而实体间关系未得到利用的问题,提出了融入知识图谱实体关系和类别的观点检索模型。在查询扩展获取候选扩展词时,不仅考虑实体文本,还考虑与实体相关的其他实体的知识,同时针对不同扩展词的差异,在模型中增加扩展词的权重因子。实验结果表明,该方法相较于(1)和(2)可以更加有效地检索到所需的观点文档。
其他文献
为了帮助引导职工种好管好自用地,新湖试验站今年出台了《职工自用地管理办法》。 该办法以职工对自用地享有种植管理权、产品销售权为原则,以给职工划好地、划近地、划近水
在当前高速铁路运营中,车载无线终端极易受到中国移动、联通等公司的GSM基站造成的阻塞、互调等各种干扰,导致CTCS-3降级、CIR语音通信掉话等.影响到铁路正常运营,甚至危及铁
本文主要通过对某电厂脱硫DCS控制系统并入主控系统过程中潜在和面临的主要问题的分析,提出相关的DCS保护逻辑优化方案。进而通过一系列的实验、分析和实施,最终解决了这些影
本文研究了复合乳酸菌制剂在防治奶牛乳房炎方面的临床效果,分别从内蒙古自治区、天津市、山东省及江苏省等7个省市(区)的14家大中型牧场的2万头奶牛样本中选取2 624头荷斯坦
文章对目前高职院校非计算机专业,计算机基础教学效果不理想的现状进行了归纳分析,提出了分层教学、分专业教学、选择合适教材、构建网络学习平台等改变现状的教学方法,旨在
农一师六团八连青年丁杰,1979年中学毕业参加工作后,就从事机务,从此与农场的机车结下了不解之缘。 工作23年来,丁杰在连队开过手扶拖拉机、东方红拖拉机和铁牛55型拖拉机,多
角蛋白是难降解纤维状蛋白,由二硫键、氢键、疏水键高度交联组成。这种结构导致角蛋白具有高机械强度,并且不被一般蛋白酶(胰蛋白酶、胃蛋白酶、木瓜蛋白酶)所降解。角蛋白是
目的探讨负压封闭引流(VSD)联合局部间歇给氧对糖尿病足的临床治疗效果。方法选取我科2010年1月-2016年9月糖尿病足患者60例,随机分为对照组(n=30)和观察组(n=30)。全部患者
4月8日,农八师工会召开自营经济工作会议,对去年发展职工自营经济先进集体进行了表彰。在各级党政工组织和广大职工共同努力下,去年师市职工自营经济总产值达9.3亿元,比2001
改进教学方式、更新教学内容、提升教学质量是高等院校教学改革的核心工作。高质量的教学改革,是提高人才培养质量的有效途径。尤其在信息化时代,大学生全面了解数据库方面的