Web文本聚类的研究与实现

来源 :长春师范学院学报：自然科学版 | 被引量 : 0次 | 上传用户：fangming286

【摘要】

：

Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技

【作者】

：

贾丙静吴长勤葛华

【机构】

：

安徽科技学院理学院

【出处】

：

长春师范学院学报：自然科学版

【发表日期】

：

2011年3期

【关键词】

：

WEB文本聚类分词特征表示特征选择 K-MEANS算法 Web text clustering word segmentation feature r

【基金项目】

：

安徽科技学院引进人才基金项目（ZRC2008176）, 安徽省教育厅自然科学基金项目（KJ2009B121Z）

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-means算法等相关技术。最后,实现了该文本聚类系统,对采集到的Web文本进行聚类,实验证明此算法具有很好的聚类结果。

其他文献

教育与劳动力市场多维探析

越来越多的＂用工荒＂、＂大学生就业难＂等社会问题将教育与劳动力市场间的关系推至风口浪尖。本文首先阐释了教育的价值体现,而后找到教育与劳动力市场的本质衔接点——人力资本理

期刊

教育价值人力资本理论教育与劳动力市场

基于本体的数字图书馆知识组织研究

20世纪80年代末以来，在人工智能和知识工程等新兴领域里，本体逐渐被广泛应用，也引起了图书情报界的极大关注。数字图书馆知识组织构建模式研究在基于本体的前提下为知识组织在语

期刊

本体数字图书馆知识组织构建模式ontologydigital libraryknowledge organizationthe mode of c

光折变空间光孤子的最新研究进展

光折变空间光孤子可以在较低光强的情况下形成,同时它在光信息处理、光学开关、光学集成等方面具有广阔的潜在应用前景。本文介绍了光折变空间光孤子的相关研究及最新进展。

期刊

非线性光学光折变效应空间光孤子nonlinear optics photorefractive effect spatial optical soli

应用型院校财务管理课程教学改革探讨

近年来,社会对应用型人才的要求不断提高,应用型院校在构建人才培养模式时,必须以正确的办学指导思想、正确的定位为前提。《财务管理》课程目前存在着教学模式陈旧、学用脱

期刊

应用型院校财务管理教学改革

单边exchange一般环的几个结果

本文推广了exchange环,定义了单边exchange一般环,并讨论了它的一些性质.证明了单边ex-change一般环I上的多项式环I[x]不是单边exchange一般环.并证明了在Ablelian条件下,cle

期刊

一般环单边exchange一般环Ablelian环clean一般环general ring one-sided exchange general ri

基于LMS算法的自适应均衡器仿真研究

自适应均衡技术可以减少数字通信过程中由于多径传播而产生的码间干扰,实时跟踪移动通信信道的时变特性.仿真比较了基于最小均方误差算法（LMS）的线性均衡器和非线性均衡器的均

期刊

自适应均衡滤波器判决反馈均衡LMS算法adaptive equalization filter decision feedback equalizati

高职院校体育教学融入心理健康教育的策略研究

采用文献资料等研究方法，结合多年教学实践，阐述了高职院校的体育教学对学生的多种心理健康教育功效，提出在体育教学活动形式、教学内容、教学方法、教学情境等方面融入心理健康

期刊

高职院校体育教学心理健康教育策略

C#垃圾回收机制验证实验的设计与实现

本文利用3个编程实例介绍了C#在内存中生成期,0代对象回收以及0、1、2代对象在内存中回收的模拟演示.

期刊

C#垃圾回收C# Garbage Collector

图书馆隐性知识共享机制研究

隐性知识对于图书馆的发展具有极高的战略价值。实现隐性知识的共享，可以提高图书馆的竞争能力。本文主要介绍了图书馆隐性知识的内涵、发展概况以及隐性知识的构成要素，分析了

期刊

图书馆隐性知识知识共享librarytacit knowledgeknowledge sharing

基于城市照明的区域性感知模型

物联网中的无线传感网络有两个基本问题：网络节点的均匀覆盖和节点能量的消耗。对此,本文提出一种基于城市照明的区域性感知模型,将无线传输节点嵌入在公共照明系统中,形成了

期刊

无线传感网络城市照明感知区域ZIGBEE技术wireless sensor network urban lighting sensing regio

Web文本聚类的研究与实现

与本文相关的学术论文