有/无约束代表点聚类、迁移分类及应用研究

来源 :江南大学 | 被引量 : 1次 | 上传用户:maowang300miao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人工智能已经成为一门综合性学科,并深入影响各行各业的发展,其中尤以机器学习的发展最为迅速。以聚类算法为例,作为一种典型的无监督学习算法,近年来获得的研究成果非常丰富。随着社会需求的不断增加,从实例中选择类中心点的聚类算法越来越受到重视和关注,即基于代表点聚类算法。另一方面,机器学习面临着许多新的应用场景,例如数据流、大数据、链接约束、迁移学习等。为了探讨基于代表点聚类算法的应用前景,本课题针对机器学习研究所面临的新的应用场景,分别改进聚类算法,并得到应用于新场景的基于代表点聚类算法。因此,本课题的具体研究成果如下:1、利用贝叶斯概率框架,并依据最大后验概率原理,提出基于代表点的贝叶斯聚类算法,称为Bayesian Exemplar-based Clustering Algorithm,BE算法。BE算法是本课题研究的出发点,该算法将两种典型的基于代表点聚类算法,即AP算法与EEM算法的目标函数联合起来,利用高斯混合模型能够平滑的近似任意形状的概率密度的性质,根据其概率密度函数,定义代表点集合的先验概率以及样本点与代表点的概率关系。BE算法将贝叶斯概率框架引入到基于代表点聚类算法中,因此有效的拓宽了这类算法的研究思路和应用场景。2、针对数据流动态聚类问题,本课题基于BE算法,提出一种新的基于代表点的数据流动态聚类算法,即Probability Drifting Dynamicα-Expansion Clustering Algorithm,PDDE算法。该算法将原数据与新数据之前的相似性嵌入到新的目标函数中,使得新数据的代表点与原数据的代表点尽可能接近,从而提高算法处理新数据的聚类性能。PDDE算法能够度量数据间的两种相似性,即1)新数据与原数据分享部分样本,2)新数据与原数据仅相似,不分享样本。3、针对大数据处理问题,采用分块处理数据的新模式,提出一种递增式基于代表点聚类算法,即Incremental Enhancedα-Expansion Move Clustering Algorithm,IEEM算法。IEEM算法在迭代过程中根据前一个数据块的代表点集合不断调整当前数据块的代表点,因此,当处理完最后一个数据块时,将得到基于整个数据集的处理结果。IEEM聚类算法不需要构造新的优化算法,而是借助了EEM算法的优化框架来解决大数据问题。4、针对成对链接约束问题,本课题将链接约束分为弱链接与强链接2类,在贝叶斯概率框架的基础上,基于原来BE算法的目标函数,通过引入一个关于链接约束的惩罚项,得到新的算法模型,即Bayesian Enhancedα-Expansion Move Clustering with Loose Link Constraints Algorithm,BEEMLC算法。BEEMLC算法既能处理弱链接约束也能处理强链接约束问题。另外,在求解新的目标函数时,BEEMLC算法改进了EEM算法中的优化框架。5、针对迁移学习中的聚类问题,本课题首先假定源域与目标域的相似性可以表现为两者代表点集合的相似性,并使用Kullback-Leiber距离度量这种相似性,从而得到一种新的算法,即Transfer Affinity Propagation based on Kullback-Leiber distance,TAP_KL算法。其次,在本课题的研究过程中,得到一个重要结论,即可以将源域与目标域的相似性嵌入到目标域数据集相似性矩阵的计算中,从而直接利用AP算法的优化框架解决新的迁移聚类问题。
其他文献
本文结合自己在住宅工程施工过程中所积累的工作经验,从电气工程施工管理的角度,系统地阐述了新建住宅电气工程质量通病的预防与控制。
2002、2003年间,我国人口向安徽、河南、重庆、四川、湖北、湖南六个人口输出大省(市)回流,与此同时,珠三角、长三角等发达地区,外来人口开始明显下降。此时,"民工荒"这一词
全球电子封装行业的无铅化趋势,使得镀层锡晶须自发生长的问题变得十分突出。由于晶须的导电性可以引起高密度封装引脚之间短路,从而使电子产品失效甚至引发灾难性的事故,因
在分析跨越敏感水域桥梁现有排水系统不足之处及由此可能引发的水环境风险的基础上,基于雨水管道极限强度理论,提出了包含桥面径流截流管及事故径流集水池的桥梁应急排水系统
邮储银行从事农户小额贷款面临大量的法律风险,具体表现为信用法律风险、法律环境风险、合同履行法律风险。其法律风险的形成主要源于邮储银行内部风险治理以及当前农村法律
长期以来,几乎所有的治安管理学基础理论都是按单一的"主客体关系即矛盾关系"来构筑的,所形成的"动态原理"不能全面反映治安管理学理论发展的需要.深入分析治安管理主客体关
随着经济的发展,科技文化的进步,物质水平的提高,各个领域都尝试着创新,人们对服装的要求也在不断的提高,传统的设计和工艺制作已经不能满足市场的需求,就使得设计师在不断的
本文介绍了兆欧表的结构及工作原理,阐述了测量绝缘电阻时应注意的问题,分析了外界电磁场干扰及表面泄漏等因素对绝缘电阻测量结果的影响,提出了正确使用兆欧表、消除测试误
目的观察调节性T细胞(regulatory T cells,Treg cells)在子宫内膜异位症(endometriosis,EMT)患者外周血中的频率及转录因子Foxp3在异位内膜、在位内膜和正常内膜组织中的表达