一种基于知网的K-means聚类算法

来源 :情报学报 | 被引量 : 0次 | 上传用户:tourena
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文通过引入知网的概念,对传统的K-means聚类算法进行了分析,初始聚类中心的选择对聚类结果有较大的影响,初始值选择的不好,可能无法得到有效的聚类结果,这也成为K-means算法的一个主要问题。采用聚类中心的搜索算法来进行聚类中心的选取,对其初始聚类中心确定一个初始划分,运用“射靶”的原理进行了改进,找到“靶心”得到一个最终选定的初始聚类中心,从而提高算法的稳定性,得到较稳定的聚类结果。实验结果表明,采用改进后的K-means作为簇心生成算法,随着待聚类文档数目的增加,效率提升更为突出。
其他文献
目的研究中药熏洗在痔疮术后治疗中的护理价值。方法将2016年1月—2017年10月收治的68例痔疮术后患者根据随机数字表法分为2组,对照组术后常规给予高锰酸钾洗剂坐浴护理,观察
如同载人航天、移动电话、龙芯,Linux在中国所面临的特殊发展境遇,我们发现,电子政务在中国正面临前所未有的良好发展态势。IT业的推动与中央政府政策的行政拉动高度吻合.各地各
期刊
在互联互通已成为今年电信监管的重点之时,网间结算软件在中国到底有多大的市场?
博士、硕士学位论文是我国拥有自主知识产权的重要信息资源和知识宝藏,具有重大的开发和利用价值。为此,科技部批准进行“国家学位论文服务体系研究”项目研究,旨在构架国家学位
索尼爱立信公司发布两款适合各个年龄用户的大门级GPRS手机新品。面向中国及亚太地区市场推出的J200。将在元旦前夕上市销售。另一款产品T290c将在2005年春节前率先在中国上
<正>原发性血小板增多症(essential thrombocythemia,ET)属于ph阴性的骨髓增殖性肿瘤中最常见的类型,以骨髓巨核细胞过度增殖、外周血血小板持续增高为特征,血栓与出血是临床
IT圈中来自宝岛台湾的人已经是越来越多。如果说“进入大陆市场”是第一阶段,那么现在的他们已经开始了第二阶段的“融入”。在华硕的许佑嘉和友讯的李伟那里,个人生活、职业
期刊
<正> 一石激起千层浪,几天前刚出台的《关于调整证券交易佣金收取标准的通知》,使得如何提高自身竞争能力成为各证券公司的生死抉择问题。而WTO之后外资券商在业务项目和人才
为了深入分析非线性评价带来的评价结果实际差距扭曲问题,本文采用回归分析法将非线性评价转换为线性评价并进行深入分析。研究结果表明,不同评价方法评价结果的用途不同,基