基于概念的文本聚类模型

来源 :SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会) | 被引量 : 0次 | 上传用户:sjzm2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着网络技术的发展,海量的文本信息随之产生。文本聚类技术所具有的对文档自动组织和导航的特性,可以方便人们从巨量的文本中快速找到自己需要的信息,因此文本聚类已经广泛应用在信息检索领域。本文针对传统的文本聚类技术在计算文本相似度时经常使用的向量空间模型所存在的缺陷,例如在同义词和多义词方面的缺陷以及对文章语义关系的割裂,提出了基于概念的文本聚类模型,通过概念关系首先提取文档的主题,再在对主题进行文档聚类。
其他文献
中国城市化和工业化的快速发展和能源消耗的迅速增加,给中国的城市带来了严重的大气污染问题.城市空气污染物主要包括总悬浮细颗粒物(PM2.5)、酸雨、NO化合物.为了及时了解空
  为了能在海量的文本中及时准确地获取有效的知识和信息,本文对多类别分类方法进行了研究,设计并实现了一个中文文本分类器。该分类器主要包括预处理模块、特征处理模块、文
采用选择性Zarrouk无机培养基从北海螺旋藻养殖场水样中富集和稀释平板分离出9株螺旋藻,经对其生长测定,从中筛选出一株生长较快、藻体粗壮的螺旋藻藻种(暂编号SP06),通过对其形态
本文对12根H型钢部分包裹再生混凝土柱进行偏心受压试验,分析了再生混凝土取代率(0、50%、100%)、偏心距(25mm、50mm、75mm)、不同强弱轴方向等影响因素对试件的影响,研究了试件的
  随着各个领域数据量的迅速增长,增量聚类算法随即被提出用来解决动态数据的聚类问题。本文介绍了增量聚类算法的分类,分析了数据在插入、删除和更新时使用增量聚类算法的益
颅面畸形占所有人类先天性疾病的3/4,影响了头部、面部和颈部的发育。颅面部的大部分骨骼都来源于颅神经嵴细胞,人类许多神经嵴病的临床症状也多与颅骨的缺陷、畸形相关。研究
据统计,全世界每年有20%左右的肉制品损失于各种腐败变质。这不仅导致经济上的损失,更危及消费者的健康和生命。其中微生物污染是导致食品腐败变质的主要原因之一。本论文以
  车标定位是车标识别系统中的重要组成部分。为了提高车标识别的精度根据车标区域的先验知识提出了一种基于特征匹配和形态学运算的车标定位方法,首先对拍摄图像进行去噪和
  人脸识别考勤系统的设计涉及人脸识别子系统和考勤管理子系统,人脸图像的检测与特征提取是系统设计的关键技术。本文提出一种利用Adaboost检测人脸与梯度方向直方图HOG方
会议
土地资源紧缺是制约当前我国经济发展的主要问题之一,盐碱地作为一种贫瘠的土地,随着社会的进步,其治理技术取得了长足的进步现已成为珍贵的后备土地资源。以往的盐碱地治理