聚类中的特征学习研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhangchi900207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类要认识世界就必须区分不同的事物并认识事物间的相似性,聚类是按照事物间的相似进行的一种无监督分类,是在对数据不作任何假设的条件下进行分析的一种工具,聚类已广泛应用于各种工程和科学领域。特征的选择和特征权值的选定对聚类效果有着较大的影响,而现有特征选择和特征学习又主要体现在有监督学习中,因此,本文针对特征学习聚类展开了研究,主要工作如下:(1)研究分析了数据挖掘中聚类算法的现状及存在问题,重点阐明划分聚类算法以及特征学习方法。(2)针对划分聚类算法对初始聚类中心选取敏感,并对特征权值的学习和聚类质量有着较大的影响,因此,提出一最大距离和初始聚类中心选取法(新加入的初始中心与已选入的所有初始中心距离和最大)。该方法能较好地将初始聚类中心分在不同的聚类中,并能与划分聚类较能好地结合。(3)为体现数据各特征对类的分离贡献的不同,研究并分析了基于Relief算法的一些特征评价函数及其存在的问题,为本文特征评价函数的构造奠定的基础和切入点。此特征评价函数在算法复杂度和类大小相差悬殊的情形下,对特征的评价均有较好表现。(4)基于新的特征评价函数,运用于特征学习聚类中,以解决特征权值取值不当对聚类产生的负面影响。并将特征学习聚类拓展到具有类属性数据聚类中。通过实验,与传统聚类进行对比、分析,证明特征学习聚类算法在提高聚类精度和特征学习上是可行和有效的。
其他文献
随着以太网技术的发展和普及,将以太网技术用于工业控制的底层网络,直接将现场设备接入工业以太网进行管理、监控和通信已成为必然趋势。目前,在很多工业现场仍旧有大量采用串行
LonWorks总线作为一种工业总线在工业控制监控系统中得到广泛应用,LNS作为其操作系统也逐渐在普及。传统基于DDE技术的访问方式已经不能满足客户端访问服务器对LNS网络进行监
人脸表情识别是近几十年来才逐渐发展起来的一个科研热点,指利用计算机分析特定人的脸部表情及变化,进而确定其内心情绪或思想活动,实现人机之间更自然更智能化的交互。它在
虚拟森林生长仿真从生态系统的角度出发,采用虚拟现实技术对森林生长的动态变化过程进行模拟,模拟结果可对林业生产的管理起到指导作用。传统的森林仿真系统往往侧重于场景的
在传统的电工电子学的实验教学中,很多学校都存在着资源不足、投资大、见效低、实验环境及过程具有一定的危险性等问题。随着多媒体技术和网络技术的迅速发展,通过网络和虚拟的
图是一种强大的数据结构,它可以表达现实世界中事物之间错综复杂的关系,如城市之间道路的连接关系,网页之间的引用关系,人与人之间的社交关系。近年来GPU体系结构的蓬勃发展让人
移动自组织网络(Mobile Ad Hoc Network, MANET)是一种无需基础设施支持的新型无线网络,具有组网灵活,易于移动与部署,抗毁能力强等特点,在军事行动、灾害救援、临时会议等场
传统的Web体系结构在代码的移植、程序的可扩展性方面产生了众多问题;另一方面,JDBC作为持久层解决方案存在着很大的局限性,而EJB必须遵循各种J2EE规范,这增加了其开发的复杂
科学技术的发展极大地促进了计算科学的进步。新一代计算机无论是计算能力还是计算速度都比以前的计算机优越,但是人类对计算的要求也在不断地提高。在实践中,有些单处理器不能
视频对象(Video Object, VO)的提取是视频信号处理领域研究的热点,在基于对象的视频编码、智能视频监控系统、人脸检测、目标识别、视频数据库检索等领域有着广泛的应用。由于