基于概念簇的多主题提取算法

来源 :智能系统学报 | 被引量 : 0次 | 上传用户:lijie041132
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界存在着大量的多主题文本,多主题在信息检索、图书情报等领域有着广泛的应用。传统主题提取算法大多是针对文本整体提取一个主题,且存在缺乏语义信息、向量高维和稀疏等缺陷。以《知网》为知识库,构建概念向量表示文本,根据概念的语义及上下文背景对同义词进行归并、对多义词进行排歧,并利用概念间语义关系实现语义相似度计算;在此基础上提出基于概念簇的多主题提取算法MEABCC,该算法通过对概念进行聚类,得到多个主题簇;在使用K-means算法进行概念聚类时,通过"预设种子"方法对其进行改进,以弥补传统K-means算
其他文献
目前,我国正处在城市化快速发展的关键时期,城市建设规模和不透水面积急剧增加。城市道路作为城市主要不透水下垫面之一,占建设用地的比例甚至超过了30%。与此同时,传统管道排水
论文是针对北京地铁车辆的轻量化进行的设计研究,按照轻量化设计的实例调研与分析、轻量化设计理论探讨以及轻量化设计应用探讨的逻辑思路进行了论文的研究与写作工作,这几方面
提出一种基于组件的模型机虚拟实验平台(CPU_VLAB)的设计模型和实现方法。CPU_VLAB采用Java语言实现,具有良好的平台无关性;以Java Bean组件技术开发模型机的基本部件,提高软件
目的比较不同年龄组人工全关节置换术后患者体温的变化情况,以便更好地进行手术后护理工作。方法对114例首次行单侧人工全关节置换手术的患者的体温变化进行观察,分别测量术
强烈的非均质性、较差的储层连通性以及复杂的微观孔隙结构是致密砂岩气产能评价难度大和准确率不高的原因,基于此,利用多口井测录井曲线资料,归纳总结典型的曲线形态类型,并
在对快速城市化、城市更新与旧城改造、经济转型期等背景下历史文化名城所面临的挑战进行总结的基础上,对我国历史文化名城保护进行了思考,提出在新形势下的一些新观念和相关措
概述昭通地区位于云南省东北部,金沙江下游的右岸,西面和北面与四川省相邻。东面与贵州省接壤。仅西南面与本省曲靖区和东川市毗连。约位于北纬26°18′~28°40′,东经102°5
二维转台以其特殊的使用环境、高精度的性能和便宜的价格等优点,被广泛地用于监控、测试以及仿真中。本文以某型二轴转台为研究对象,研究转台的设计方法和分析方法。利用多体
目的:观察不同全身麻醉方法在预防小儿全麻并发症喉痉挛中的作用,降低其喉痉挛的发生率。方法:选择1~3岁小儿择期下腹部及四肢短小手术全身麻醉180例,随机分为观察组即气管插
大量的研究表明,金黄色葡萄球菌是引起奶牛乳房炎亚临床感染的主要病原菌,其引起的泌乳系统疾病即奶牛乳房炎严重影响牛奶的品质及奶牛养殖业的发展,金黄色葡萄球菌引发的奶