文本聚类中文本表示和相似度计算研究综述

来源 :情报科学 | 被引量 : 0次 | 上传用户:junar
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
围绕文本聚类中的文本表示和相似度计算两个基本的问题,对目前学界提出的文本表示方法和相似度计算方法进行了分类和较为全面的综述,将文本表示模型分为向量空间模型、语言模型、后缀树模型、本体等,相似度计算方法分为基于向量空间模型的相似度计算,基于短语的相似度计算方法和基于本体的相似度计算方法。
其他文献
利用1997~2011年我国26个省(自治区)的农村居民和城镇居民的家庭收支调查数据,在构建省级动态面板数据模型的基础上,运用系统广义矩估计方法对农村居民的信息消费行为进行了
2006年10月,党的十六届六中全会第一次提出了要建设社会主义核心价值体系的战略任务,在全社会引起了广泛关注。党的十七大报告指出:“切实把社会主义核心价值体系融入国民教
本文分析了汉语加快走向世界面临的形势,提出了汉语国际推广工作要实现“六大转变”的发展思路,强调以体制创新为核心,以师资、孔子学院和教材建设为重点,以重组网络资源、构
股利政策是上市公司最重要的财务管理政策之一,自股份公司成立之日起,国内外理论界和实务界就开始将目光投向公司的股利分配问题。适度稳定的股利政策能够为公司吸引到更多的
光电产业在经济,社会和国家安全的很多领域都有着广泛的需求,在建设创新型国家的进程中,光电产业的作用将越来越凸显出来。作为一个高科技产业,它对地区的意义不仅仅在于创造
目的:评价退变性腰椎侧凸(degenerative lumbar scoliosis,DLS)患者行长节段固定矫形术的疗效,探讨合适的腰椎前凸矫正程度。方法:回顾性分析55例行长节段矫形固定术(至少4个
<正>2013年7月24日,在国务院办公厅印发的《深化医药卫生体制改革2013年主要工作安排》中,建立医保经办机构与医疗机构、药品供应商的谈判机制,成为2013年医改的重要内容之一
苯甲醛作为一种重要的有机原料和精细化工产品在工业、农业和医药等领域中应用非常广泛。由苯甲醇氧化法合成苯甲醛是众多合成方法中开发其清洁生产的方法之一。本论文的主要
<正> 河南南阳图书馆最近在古藉整理研究工作中,发现了已疑为佚失的范蠡《养鱼经》全卷。 范蠡,字少伯,春秋楚宛三户人,是举世公认的著名政治家和商业家。范蠡所著的《养鱼经