搜索引擎中基于无向图的聚类算法研究

来源 :第五届中国软件工程大会 | 被引量 : 0次 | 上传用户:a170911
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种搜索引擎中基于无向图的聚类算法。算法先根据返回网页的相关信息计算网页间的相似性,再将检索结果及其相似性关系映射为无向图,然后从图中随机选取几个点作为初时质心,依次计算剩余点与质心的相似度,根据其与阀值的关系决定是否将其加入某个簇,直至加入全部的点,从而将返回结果组织为有限的几类,提高用户检索信息的效率。理论分析表明,提出的聚类算法在一定程度上解决了文档多义性问题及孤立点问题。 实验结果也表明,所提的聚类算法具有较好的效果,能有效聚类返回结果。
其他文献
因为图像数据是非平稳且具有很强局部特性的数字信号,为了获得高分辨率的插值图像,提出采用基于经验模式分解(EMD)的图像插值算法。充分利用已知数据,提出改进的获得IMF的算法,不
会议
组件技术是目前软件开发的主流技术,而如何验证组件组合的正确性是一个值得关注的问题。使用行为协议建模组件组合,结合例子研究将行为协议转换为Promela的方法,使用模型检验工
通过研究分析RMI(远程方法调用)技术,设计了接口网关软件来统一地透明地访问和调用不同类型的分布式计算服务。 分析了分布式计算技术的公共特征RMI;提出了接口网关软件模
会议
当前我国商品住宅市场呈现出两个主要特点,一是房价涨幅较快,2004年上涨了15.2%,2005年一季度比上年同期又上涨了13.5%。据国家统计局城调队对35个大中城市的抽样调查,2005年第
基于特征的网络入侵检测系统的性能主要依赖于数据包和特征之间的模式匹配效率,因此提高模式匹配算法的处理速度具有重要意义。通过对著名的单模式匹配算法Boyer—Moore、Hors