一种集成簇内和簇间距离的加权k-means聚类方法

来源 :计算机学报 | 被引量 : 0次 | 上传用户:qqllql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘与分析最重要的方法之一.它把相似的数据对象归类到一个簇,把不同的数据对象尽可能分到不同的簇.其中k-means聚类算法,由于其简单性和高效性,被广泛运用于解决各种现实问题,例如文本演化分析、图像聚类、社区发现等.然而在聚类过程中,大部分现有的类k-means算法主要考虑簇内距离,而忽略了簇间距离的作用.本文结合特征加权方法,提出了一种新的集成簇内和簇间距离的加权k-means方法(a weighting k-means clustering approach by integrating
其他文献
基于行业异质性视角,文章主要考察出口二元边际对劳动生产率的影响。利用UN Comtrade数据库,采用HK指数法测度中国出口深度边际和出口广度边际,发现中国出口产品种类基本覆盖
少数服从多数原则是民主的一般原则,是民主的本质特征和重要标志,有其应有的地位和作用。但是少数服从多数原则具有局限性,不是在任何领域都可以适用的,如在行政决策领域适用的是
新中国成立以来,特别是改革开放40余年来,中国确实拥有一个以实现现代化为核心指向的恒定大战略。“一带一路”倡议的出台则是在新时代贯彻落实这一大战略的集中体现。所不同
当前,我国经济发展步入新常态,为深入贯彻学习习近平总书记系列重要讲话精神和治国理政新理念新思想新战略,按照统筹推进“五位一体”总体布局和协调推进“四个全面”战略布
探讨了有线电视运营商通过大数据分析开展社区化服务的可行性以及实现的技术方案。首先介绍了有线电视的优势和广电的大数据,然后分析了广电大数据与社区化服务结合的可行性,
应用MF—27型方波电磁血流量计,在30只家兔上测定了肾动脉以下的腹主动脉血流量,其正常值为20.3±6.8ml/min/kg。结果表明:本测定方法可重复性好,较为稳定可靠,且对病理刺激
科技孵化器是助推企业技术创新、加速高新技术产业发展的全新社会载体。构建基于信息、通讯技术的虚拟科技孵化网络是我国自主创新能力建设的重要组成部分。作者着眼于我国自
利用Boole函数的一些基本变换和相应的不变量,给出了两个结果:1.Boole函数仿射等价的判定和等价关系求取算法,该算法对Boole函数的科学研究和工程实践都具有重要意义.例如,该
<正>8月14日,歌华有线发布公告称,按照国家新闻出版广电总局《关于同意北京广播电视台开展移动通信网手机电视内容服务和互联网电视内容服务的批复》要求,已完成手机电视内容
该文揭示,目前常用的模糊控制算法都可归结为某种插值方法,它是对响应函数的逼近,相当于离散响应函数的拟合;这意味着,模糊控制方法类似于数学物理问题中的有限元方法,是经典控制论