【摘 要】
:
近邻传播聚类算法(Affinity Propagation,AP)是近年出现的无监督聚类算法,但实际应用中存在两点不足:(1)AP算法默认将所有的数据样本点均看作是候选的聚类中心点,并通过偏向
论文部分内容阅读
近邻传播聚类算法(Affinity Propagation,AP)是近年出现的无监督聚类算法,但实际应用中存在两点不足:(1)AP算法默认将所有的数据样本点均看作是候选的聚类中心点,并通过偏向参数取相同的值描述各数据样本成为聚类中心的概率相同,因未能区分各数据样本成为聚类中心的差别,因而算法迭代次数过多,聚类计算效率低。(2)AP算法在面对团簇类的数据集时聚类效果比较好,但对样本密度分布稀疏度不均匀的数据样本区分能力较弱,聚类结果较差。针对AP算法以上两点不足,本文提出一种局部密度优化的量子AP聚类算法,主要研究工作如下。1.针对前述的问题(1),用量子进化算法优化AP算法的偏向参数,通过量子搜索发现各数据样本成为聚类中心的概率,从而实现在偏向参数中加入聚类中心的启发式先验知识。首先用量子叠加态编码偏向参数,再用量子旋转门搜索量子叠加态,找出近忧的偏向参数供AP算法聚类,达到自适应优化AP偏向参数的目的。针对AP算法对结构不规整数据辨识度不高的问题,使用高斯核函数代替欧式距离作为相似度的度量方式,将数据从低维空间映射到高维空间,提高算法对复杂数据的辨识能力。2.针对前述的问题(2),引入局部密度优化策略对稀疏度较大的数据点进行标记,在聚类结束之后依照密度关系对其进行重新划分,达到区分数据样本分布密度的目的。最后在UCI数据集上验证所提算法,实验结果表明:本文算法的聚类精度和聚类效率上均优于相比较的同类算法,改进AP算法的思路是可行的。
其他文献
数字工艺模拟是当前制造业重要的辅助设计手段,对于缩短设计周期,减少设计成本有重要的作用,铸造行业对于数字模拟的研究也一直是一个应用热点。对铸造工艺产品产生影响的要
无线移动通信网络的蓬勃式发展在不断满足移动用户日益增长的需求的同时也给网络的能源消耗带来了巨大的问题。随着人类环境意识和经济意识的提高,能量消耗已经成为未来信息
推荐系统为用户提供了关于产品和服务的个性化推荐。在以往的推荐系统中,用户兴趣一直是被认为不随时间改变的。这些以往的推荐系统弱化了用户的兴趣改变。实际上用户的兴趣
目前手机成为人们必不可少的使用工具,因而涌现大量应用程序,借此用户能够随时随地获取网络上的数据和服务;与此同时,国家也大力支持和推进互联网与各行业的协同发展,因此将
网络密集化对于提升网络容量具有显著的优势。然而,这种动态、密集的网络面临着干扰、移动性、回程链路、能耗等方面的挑战。特别是在室外移动场景下,超密集网络需要与整个无
在信息交互日趋频繁的社会中,对个人身份认证的需求越来越多,生物特征识别相对传统的身份认证手段具有更高的可靠性。人的手掌包含丰富的静脉信息和掌纹信息,结合静脉和掌纹
全球移动数据流量的爆发式增长,其中主要是多媒体数据,导致网络中用户延迟加重,给基站到核心网的回程链路带来了严重负担。回程链路中的网络拥塞又可能会导致更严重的传输时
作为研究计划报告的意图书写的论文,主要是阐明我的创作思想。将创作灵感的来源、创作状况、实践经验以及绘画语言的分析作为文章中逐一阐述的内容。我的绘画创作内容主要围
在现如今的信息时代里,信息的存储、传递过程中的安全性成为人们非常关注的事情,而密码学的存在为信息的安全性提供了保障。分组加密算法是密码学中非常重要的组成部分,到目
本文聚焦战后上海市救济院妇女教养所(1946-1949),从治理城市贫困人口问题的角度理解社会救济,进而探讨底层女性在战后上海社会治理活动中的处境,以及阶级身份对战后上海女性