Web文本聚类的研究与实现

来源 :长春师范学院学报:自然科学版 | 被引量 : 0次 | 上传用户:fangming286
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web文本聚类是使文本之间具有最大的簇内相似性,同时具有最小的簇间相似性,它是一个将文本集分组的全自动处理过程。本文首先提出了Web文本聚类模型,然后对Web文本聚类关键技术进行了深入的研究,讨论了分词、特征表示、特征选择和K-means算法等相关技术。最后,实现了该文本聚类系统,对采集到的Web文本进行聚类,实验证明此算法具有很好的聚类结果。
其他文献
越来越多的"用工荒"、"大学生就业难"等社会问题将教育与劳动力市场间的关系推至风口浪尖。本文首先阐释了教育的价值体现,而后找到教育与劳动力市场的本质衔接点——人力资本理
20世纪80年代末以来,在人工智能和知识工程等新兴领域里,本体逐渐被广泛应用,也引起了图书情报界的极大关注。数字图书馆知识组织构建模式研究在基于本体的前提下为知识组织在语
光折变空间光孤子可以在较低光强的情况下形成,同时它在光信息处理、光学开关、光学集成等方面具有广阔的潜在应用前景。本文介绍了光折变空间光孤子的相关研究及最新进展。
近年来,社会对应用型人才的要求不断提高,应用型院校在构建人才培养模式时,必须以正确的办学指导思想、正确的定位为前提。《财务管理》课程目前存在着教学模式陈旧、学用脱
本文推广了exchange环,定义了单边exchange一般环,并讨论了它的一些性质.证明了单边ex-change一般环I上的多项式环I[x]不是单边exchange一般环.并证明了在Ablelian条件下,cle
自适应均衡技术可以减少数字通信过程中由于多径传播而产生的码间干扰,实时跟踪移动通信信道的时变特性.仿真比较了基于最小均方误差算法(LMS)的线性均衡器和非线性均衡器的均
采用文献资料等研究方法,结合多年教学实践,阐述了高职院校的体育教学对学生的多种心理健康教育功效,提出在体育教学活动形式、教学内容、教学方法、教学情境等方面融入心理健康
本文利用3个编程实例介绍了C#在内存中生成期,0代对象回收以及0、1、2代对象在内存中回收的模拟演示.
隐性知识对于图书馆的发展具有极高的战略价值。实现隐性知识的共享,可以提高图书馆的竞争能力。本文主要介绍了图书馆隐性知识的内涵、发展概况以及隐性知识的构成要素,分析了
物联网中的无线传感网络有两个基本问题:网络节点的均匀覆盖和节点能量的消耗。对此,本文提出一种基于城市照明的区域性感知模型,将无线传输节点嵌入在公共照明系统中,形成了