基于仿射传播聚类算法的改进研究

被引量 : 0次 | 上传用户:luckymanjxj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
乜速发展的计算机技术,使得越来越多的数据信息充斥在人类生活的各个角落。如何更好的解决大规模和高维度的数据信息的检索问题,不但能将样本信息、按照对象间的相似度划分,而且能快速的选出代表样本集的类代表点,学者提出了一种新的算法一仿射传播聚类算法。已经有文献证明,标准的仿射传播算法不仅在聚类规模上超过了经典的K均值算法,而且在聚类时间上更是略胜一筹。传统的仿射传播算法计算样本点之间的相似性采用的是将样本点所有的特征都等同看待的欧式距离函数,采用何种距离测度,才能更好的反应样本空间的特征,本文正是针对此问题,采用几种不同的距离函数计算样本集的相似性,并比较了每种算法的聚类结果,最后就如何提高算法的聚类速度问题,对偏向参数的搜索策略做了相关的改进。本论文阐述并总结了标准的仿射传播算法的基本原理,重点分析了算法的几个重要参数。现有的对标准算法的一些改进算法大都采用欧氏距离函数计算数据点之间的相似性,算法比较单一,有时无法反应样本集的真实的空间特征。本文针对不同空间特征的数据集,采用了三种距离函数:欧氏距离、曼哈顿距离以及特征距离分别计算不同维度下的数据点集,以及图像的灰度矩阵的相似度,然后采用标准的仿射传播聚类算法进行聚类。实验结果表明,对于不同的特征空间应该采用不同的距离函数计算样本集的相似度矩阵,才能得到更高质量的聚类结果。传统的仿射传播聚类算法采用顺序查找法查找聚类质量最高的聚类结果对应的偏向参数,此方法花费的时间比较长,特别是在最坏的情况下,需要搜索整个偏向参数的空间。在追求聚类质量的前提下,为了提高聚类的速度,本文的第四章采用二分法的搜索策略查找最优的聚类结果对应的偏向参数,最后进行了仿真实验,从仿真结果中得出,改进后的算法与预期期望的结果相符,有效的降低了花费在迭代运算过程中的时间,提高了算法的聚类速度。
其他文献
马克思劳资关系理论是马克思主义政治经济学的核心理论。《资本论》实质上就是一种劳资关系理论,剩余价值生产过程中的劳资关系理论,是研究《资本论》中剩余价值理论的核心。
<正>国务院取消部分特种行业、娱乐服务场所的行政审批项目,进一步促进了社会资源的优化配置和市场经济的健康发展,也为治安管理工作提出了新的课题。公安机关面对新的实际,
<正>女作家迟子建说袁炳发是黑龙江小小说的领军人物,在全国也是这块园地的"园艺"高手。这个评价应该是中肯的。所谓领军人物,不仅是指袁炳发的小小说在该地区独领风骚,重要
台湾青年学生的反服贸网络政治参与具有显著的非理性特征。非理性参与的危害主要表现为:互联网构建的新"广场效应"撕裂服贸协议,形成群众运动绑架公共决策模式,将进一步加剧
<正>关节风湿症是指关节、肌肉、筋膜及周围软组织出现疼痛或感觉异常,但关节不肿,相关实验室及物理检查完全正常的一类综合症的统称。临床也称"良性关节炎"、"非特异性关节
美术教师结合专业特点,利用学校的展厅,把主题性的课程开设的丰富多彩。面对宽敞明亮的大展厅,如何形成一种合理的空间关系;让人感觉这不是一个空空荡荡的大厅,把展厅变成了
城乡居民大病保险采取政府部门向商业机构购买保险的方式运作,是我国公共管理改革的一次有益探索。从公私伙伴关系视角构建的"责任主体—治理方式—风险配置"分析框架,有助于
基层社会管理是当今社会管理的重点领域,社会管理要实现公民的权利和公序良俗,就必须引入公民参与。根据谢尔·阿斯廷的公民参与阶梯理论,当前中国基层社会管理中的公民参与
本文运用以史证词、象征意象分析、整体情感意向把握等方法 ,对冯延巳的比兴寄托词进行系统全面的辨别和分析 ,从而使人们对冯延巳创作的比兴寄托词有一个比较全面和清楚的认