一种改进的K-means算法

来源 :电脑开发与应用 | 被引量 : 0次 | 上传用户:shires2006
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
K-means算法以其简单性和快速性在文本聚类中得到广泛应用,但是传统的K-means算法对初值的依赖性很强,需要事先给出要生成的簇的数目k,而这个参数k的确定一般是根据用户的经验知识给出的;另外,其初始聚类中心是随机选取的,这种随机性往往导致聚类结果的不稳定。可以说,不同的k值和不同的初始聚类中心对聚类质量和时间效率造成的影响是很大的。实验对改进K-means算法的有效性进行了验证,结果证明,改进K-means算法能有效地解决传统K-means算法的随机性所产生的聚类效果不稳定的问题,其时间复杂度也有所降低。
其他文献
地理标志,作为与专利和商标并列的知识产权,是特定产品来源的标志和质量的象征。它引导着消费者的购买趋向,孕育着巨大的财富。地理标志和商标一样,是带动经济发展的重要工具,尤其
随着我国体育表演市场的发展和开放,使得起步不久的全国排球联赛竞争环境日益艰难,处在竞争中的全国排球联赛如何取得竞争优势,是必须面对的首要问题。本文以品牌学的最新成
关于证券市场的信用问题一直以来倍受学者们关注。由于经济体制的差异,国外的文献主要研究了个人信用与组织信用之间的相互转化关系,未能将政府信用纳入其中。而中国的特殊性在
渗透蒸发是一种新型膜分离技术,对共沸或近沸混合体系的分离,微量水或有机物的脱除以及有机-有机混合物的分离等具有独特的优越性,在石油化工、制药、食品、环境、生物、能源等
随着我国跨境电商的发展,海外仓储变得越来越重要。第三方物流公司海外仓建设战略价值也日益凸显。目前,第三方物流公司海外仓在供应链的延伸服务、与跨境电商信息沟通、一体
本文结合锅炉安装实际,对锅炉安装中容易出现的受热面管排偏差问题以及该问题引发的其他质量问题作详细分析,探讨了问题产生的原因,并在此基础上给出了几点相应的问题与解决
本文借助于隔网对抗项群竞技基本单元过程的理论平台,对高水平女子排球竞技过程的规律进行定量分析和研究。通过对多场高水平女子排球竞技过程的深入探讨和解析,准确把握排球
随着我国体育教育事业的不断发展,研究生教育改革的不断深化,篮球专业研究生的培养也呈现出蒸蒸日上的新局面。作为研究生科研综合能力具体体现的学位论文,无论在选题范围,研
运用评价理论,对2007-2010年国内每年的十大网络流行语中明显涉及态度资源的流行语进行积极话语分析,帮助人们对这一特殊的语言群体形成客观、正确的认识,并认清其背后所隐含
熵是一个非常重要的概念,同时也很抽象,在理解上存在很多困难。本文从熵的起源、本质上进行了阐述,并对熵在多个领域中的应用及理解作了详细的讨论。