一种基于K—means算法的主题数据库规划方法

来源 :信息工程期刊:中英文版 | 被引量 : 0次 | 上传用户:yu0426
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主题数据库规划一直是信息资源规划领域研究的重点,而实体聚合算法是影响主题数据库规划质量的关键。但是现有的计算实体聚合毖方法很容易陷入聚簇偏置,影响了规划质量。针对这一问题,作者首先计算实体对的亲和毖,然后将实体对的亲和关系看作网页之间的链接关系,使用PageRaxtk算法对实体对重要性排序,进而使用K—means算法迭代来聚合实体。实验结果表明本文提出的方法能够避免聚簇偏置,进而改善了主题数据库规划质量。
其他文献
针对李雅庄矿选煤厂煤泥水系统存在的问题,采用两段浓缩+卧式沉降离心脱水机工艺对煤泥水系统进行改造,从而调整了产品结构,保障了洗水质量,提高了经济效益。
进入2010年,多发的地震让人们戏言地球已经“调至振动模式”,BP在墨西哥湾的漏油事件又聚集了全世界的目光。不堪重负的地球家园已经不允许人们再恣意妄为,节能减排已成为当今最
针对Duffing系统检测未知信号时需要待测周期信号频率先验值的不足,提出了一种混沌理论与随机共振理论相结合的信号检测方法。该方法首先利用随机共振系统对信号进行检测与频
实施西部大开发战略以来,西部地区产业结构调整速度明显加快,产业结构发生了明显的变化,但与东部地区相比,产业结构仍较落后。当前,西部地区产业结构存在三次产业结构发展极不平衡
随着网络技术的发展和图像、视频需求量的增大,图像压缩的应用和研究日益广泛。在总结相关工作的基础上,介绍了张量投票方法在图像压缩中的应用,给出了算法流程及典型实验结果,并
一、风险投资的概念风险投资在我国是近几年随着社会主义市场经济体制和科研体制改革的深入发展才崭露头角的新生事物。面对知识经济时代的挑战,不仅要创建国家知识创新体系,更
密云县地处北京市东北部燕山山脉脚下,历史悠久、人文荟萃,有“北京山水大观,首都郊野公囝”之美誉。今天的密云,政通人和,经济和社会事业蓬勃发展、生机盎然,一座现代化的京郊新城
面对日益变化的国内国际市场竞争特点,企业只有通过管理创新,创造新价值,才能立于市场不败之地,只有不断进行管理创新,企业在复杂多变的市场竞争中才能得以取胜。