基于公共词集对长篇小说相似度的研究

来源 :软件工程 | 被引量 : 9次 | 上传用户：philiploo

【摘要】

：

传统的文本相似度计算基于向量空间模型(VSM),文本映射成独立的、互不关联的词构成的向量。由于长篇小说具有比普通文本更为复杂的构成元素,以及更加紧密的上下文联系,传统算法忽略词项的上下文联系,并且产生高维向量,因此算法的效率和精度不理想。为此,本文基于公共词集对长篇小说进行相似度计算,并对公共词集进行上下文约束检查,得到关联比较紧密的词集,作为小说的主要特征。实验结果表明,对于某些小说类型,效果有

【作者】

：

郭涛霸元婕李绍昂

【机构】

：

吉林大学计算机科学与技术系

【出处】

：

软件工程

【发表日期】

：

2018年10期

【关键词】

：

公共词集小说相似度上下文约束 common word setnovel similaritycontext constraint

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

企业主导下的现代学徒制实施模式研究

伴随着我国经济转型、后工业社会到来,教育理念和技术设备的变化,高职教育面临新问题、新挑战和新机遇。在教育部大力推行"现代学徒制"的大背景下,分析高职教育培养过程存在

期刊

高职教育现代学徒制翻转课程实施模式

简析港口疏浚工程施工技术难点及其质量控制措施

交通运输的建设与发展是一个国家经济建设的战略重点,航空运输、铁路运输、公路运输、管道运输以及水运运输是现代交通运输的五大运输形式。不同的运输形式都有自身的特点与

期刊

施工质量工程施工航道疏浚

把扶贫督查再盯紧

确保扶贫成效，重在加强督查。近日，国务院扶贫开发领导小组第15督查组对我省脱贫攻坚工作进行了实地督查，并对督查情况进行了反馈。我们要根据督查组反馈的意见，列出问题清单，研究

报纸

大众化背景下高校管理多元化与长效性发展机制研究

大众化发展背景下高校管理面临着许多挑战。实现多元化与长效性发展是高校管理的突破点。高校应树立开放互动的管理理念，明确管理目标，建立多元化的教育质量标准，引导多方参与管

期刊

大众化高校多元化长效性管理

硼替佐米联合地塞米松及沙利度胺治疗多发性骨髓瘤的临床疗效观察

目的探讨硼替佐米联合地塞米松及沙利度胺治疗多发性骨髓瘤(MM)的临床疗效。方法抽取至我院就诊的60例多发性骨髓瘤患者,其中一组采取一般方案进行治疗,另外一组采取硼替佐米

期刊

多发性骨髓瘤硼替佐米地塞米松沙利度胺

寄自纪检干部的廉洁家书

仲夏时节，醅热难当。7月4日下午3点半，四川泸州市纳溪区卫计局纪委书记陈显荣正在该区的东升街道为纪检干部讲课。“党员干部要廉洁奉公，首先要求咱们纪检干部要公正无私。”陈

期刊

纪检干部纪委书记纳溪区

不断增强党在长期执政条件下的自我革新能力

党的十八届六中全会通过的《关于新形势下党内政治生活的若干准则》，明确提出要“着力增强党自我净化、自我完善、自我革新、自我提高能力”，为推进全面从严治党、提高党的创造

报纸

尼尔雌醇和倍美力用于绝经后妇女取环的效果比较

目的:比较尼尔雌醇和倍美力用于绝经后妇女取环的效果,以期得到更多的有效的方法用于绝经后妇女取环。方法:将73例绝经1 a以上要求取环的妇女,随机分为二组,甲组给予口服尼尔

期刊

绝经后期宫内避孕器炔雌醚/类似物和衍生物倍美力

基于OLAP的道路交通事故影响因素分析

本文通过数据挖掘相关基础进行数据库搭建,选取2002—2016年数据进行OLAP分析,通过数据切片及数据向下钻取,将二维数据转换成三维数据进行深度剖析,结果显示全国道路交通事故影响因素主要集中在机动车超速行驶及逆向行驶中,其中驾驶人行为尤为突出。在Eviews软件中对数据进行预测分析发现道路交通事故存在非线性关系,并且预测了未来三年的道路交通事故数量及伤亡数量,数据显示出道路交通事故呈逐年下降趋势

期刊

数据挖掘联机分析处理交通事故预测分析

高校创新团队建设的必要性及组织优势分析

高校创新团队是时代发展和建设“双一流”大学的必然选择。国家对创新的高度重视以及系列支持计划的出台为高校创新团队的构建与发展提供了必要条件。高校创新团队以其灵活的

期刊

创新团队必要性组织优势

基于公共词集对长篇小说相似度的研究

与本文相关的学术论文