kmeans聚类算法的改进及其在信息检索系统中的应用

来源 :云南大学 | 被引量 : 0次 | 上传用户:ywx789789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,信息飞速增长。怎样从杂乱的信息中,准确、及时获得有利信息已成为现今面临并急需解决的一个巨大问题。信息检索技术的出现为高速、有效地获取信息提供了很好的途径,其中搜索引擎就是最好的代表。如何对检索到的结果进行分类管理是信息检索过程中最为重要的一部分直接影响着结果其有效性。聚类的出现就很好地实现了对大量信息的有效管理,并且聚类现今不仅是在信息检索方面应用广泛,同时在有关多文本处理等领域也得到了应用。原有Kmeans聚类算法,为应用最为普遍的聚类算法。但需要人为设定聚类数目以及其初始聚类中心是随机选取。基于原有Kmeans聚类算法存在的问题,本文介绍了如何结合二叉树及原有Kmeans聚类算法来解决Kmeans聚类算法存在的一些问题。改进后的算法其主要包括两部分。一部分是对聚类对象进行建树,另一部分是对建好的树进行剪枝操作,这两个部分紧密相连缺一不可。根据改进后的算法的特性将其应用于信息检索系统中。改进后的聚类算法是在Eclipse平台实现的,并且在信息检索系统中取得了很好的聚类效果。
其他文献
中医皮科外治法系列讲座第5讲酒浸剂的使用张作舟,刘瓦利,方平中国中医研究院广安门医院(100053)1概论酒浸剂是用酒浸泡药物制成的制剂。古人常用白酒或黄酒浸泡药物,现多用酒精浸药并过滤
风扇是进入家庭较早的家用电器,社会拥有量较高。随着人们生活水平的提高,风扇的产品功能也越来越多。因此,如何通过对风扇进行合理、科学的设计,从而提高它的安全性能,是实
根据现场磨煤机液压油站产生缺陷的处理,分析了主要缺陷"液压油压低于额定值"产生的原因,提出了系列创新改进措施,从而降低磨煤机液压油站缺陷数,总结检修维护的方法?
<正> 美国著名文化人类学家理安·艾斯勒(Riane Eisler)曾明确地指出,在中国文化中,“女性特征”在诸多方面(比如中国人极强的审美敏感性以及对社会、亲缘关系和孝顺的极端重
在全国出版专业职业资格考试中,无论是初级还是中级试卷,都包含了审稿题、编辑加工题和校对题这三种涉及编辑案头工作的综合题题型。这三种题型所指向的审稿、编辑加工和校对
目的观察"贺氏三通法"之"温通法"治疗2型糖尿病周围神经病变(diabetic peripheral neuropathy,DPN)的临床疗效和安全性。方法按照随机化分组原则,将57例DPN患者随机分为观察
针对青岛市利用遥感技术辅助指导枯死松木地面调查的新模式,旨在解决外业调查区划和多点路线选择问题。基于DEM数据设计和实现了复杂地形下两调查点之间互相抵达的路径成本算
利用等效热降理论 ,对 1台 1 2 5 MW汽轮发电机组补水方式的改进进行了经济分析。结果表明 ,改变补水方式可提高机组热经济性 ,节能效果显著