【摘 要】
:
近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因
【机 构】
:
郑州轻工业学院计算机与通信工程学院
【基金项目】
:
国家自然科学基金项目(61672470);北京市重点实验室开放课题(BKBD-2017KF08)
论文部分内容阅读
近邻传播(Affinity Propagation,AP)聚类是基于数据点间消息传递的算法,主要通过数据间的相似度实现聚类.与传统的聚类方法相比,AP聚类无需事先给定聚类数目就可实现聚类,因此具有快速高效的优点,然而在处理高维复杂数据集时存在随着聚类效率提升而准确度不高的问题.为改善AP聚类算法的效率和精度,提出基于类内和类间距离的粗粒度并行AP聚类算法——IOCAP.首先引入粒度思想将初始数据集划分成多个子集;其次对各子集结合类内和类间距离进行相似度矩阵的改进计算,最后基于MapReduce模型实现改进后的并行AP聚类.在真实数据集上的实验表明,IOCAP算法在大数据集上有较好的适应性,能在保持AP聚类效果的同时有效地提升算法精度.
其他文献
篇章语言学的迅速发展丰富了翻译理论。翻译单位已经从词汇层、语句层扩展到语篇层。译者要在翻译过程的各个阶段操作词汇和语法,更要自始至终地把语篇当作一个整体来看待。理
目的观察和分析患儿皮肤感染金黄色葡萄球菌的耐药性,为临床选择适当的抗菌药物提供参考依据。方法选取2010年1月-2012年12月246例脓疱疮皮肤感染患儿作为研究对象,对其送检
本课题在中医理论指导下,进行了慢性马兜铃酸肾病的中医证候学研究。希望通过该研究,把握本病发展的基本规律,深入探讨本病病因病机,为临床治疗提供指导。 论文主要包括文献综
在通货膨胀目标制下,货币政策的决策依据主要依靠定期对通货膨胀预测,如果预测值超出目标范围,货币当局会立即采取挽救措施。由于消费价格指数是进行经济预测的核心指数,更新速度
讨论了工业机器人常用手部的分类,对不同类型的手部进行了使用特点和结构形式的分析,并对实际使用中 的某些机器人手部典型结构进行了详细分析,为了解机器人手部结构和进行手部
目的:了解大学生网络成瘾状况,并对网络成瘾现象和行为对大学生心理健康水平和人格特征的影响进行分析。方法:共有514名黑龙江省某大学学生参加本研究,其中男生439人,女生75
论文系统的研究了凹凸棒土(AT)在橡胶复合物中的分散、AT增强橡胶复合材料的制备、结构与性能,并采用常规的聚合物熔体共混法,制备了SBR/ AT、NR/AT、NBR/AT、CNBR/AT、EPDM
在目前的医院人事制度改革中,我们需要的是建立系统的基础性的人力资源管理制度,无论是医院的聘任管理,还是薪酬制度的改革还是医院的绩效考核,都需要医院尽快建立一套责权利
对计算机视觉在自主车、机器人定位、车辆检测、辅助驾驶、智能交通视频监控、行人检测以及人脸识别等方面的应用研究情况进行了综述,指出提高视觉传感器在恶劣天气情况下的
目的探讨老年慢性阻塞性肺病急性加重期(AECOPD)患者呼吸道致病菌分布与耐药性,为临床用药提供有效依据。方法对380例AECOPD患者进行呼吸道致病菌鉴定与药敏试验,以分析其菌群