监督和半监督典型相关分析及其应用研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:tianxiuli_ok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
典型相关分析(CCA)作为经典的多元数据分析方法,通过研究两组变量之间的相关关系来进行特征提取,近年来已开始在模式识别和机器学习等多个领域得到广泛的应用。但一方面,CCA作为一种全局线性特征提取方法,不足以很好地描述非线性问题,缺乏对局部变化的识别鲁棒性。另一方面,在半监督学习兴起的热潮下,还可以考虑将半监督技术引入到CCA中,以更好的利用先验信息。本文围绕这两个方面对CCA进行扩展研究,致力于用扩展的CCA模型来解决机器学习和模式识别中的分类问题。本文的创新性研究成果总结如下:(1)为解决CCA不足以很好的描述非线性问题,提出了一种新的有监督学习方法---局部判别型CCA。该方法引入样本的类信息,并同时考虑了同类样本之间的局部相关与不同类样本之间的局部相关关系及其对分类的影响。利用核技巧,进一步提出了核化的局部判别型CCA,用以解决较为复杂的线性不可分问题。LDCCA和KLDCCA提取的特征能够实现同类样本之间的相关最大化,同时使得不同类样本之间的相关最小化,这将有利于模式的分类。在人工数据集、多特征手写体数据集和人脸数据集(Yale和AR)上的实验结果表明:这两种方法具有较高的识别性能。(2)通过引入以成对约束形式给出的监督信息,提出了一种半监督的典型相关分析算法(Semi-CCA)。在此算法中,除了考虑大量的无标号样本以外,还考虑成对约束信息,即已知两样本属于同一类(正约束)或不属于同一类(负约束),同时验证了两者的相对重要性。同时,为解决广泛存在的非线性问题,对Semi-CCA进行了核化,提出了KSemi-CCA。在多个数据集上的实验结果表明:Semi-CCA和KSemi-CCA能够有效地利用少量的监督信息来提高分类性能。(3)在对行为识别深入研究的基础上,将提出的半监督CCA和局部判别型CCA以及他们的核化算法用于简单的行为识别,实验结果表明:利用我们的算法提取的特征对最终的行为分类具有较好的决定作用。
其他文献
在数据集成和信息网络技术领域中,如何解决“信息孤岛”问题以更好的利用网络上浩如烟海的异构信息一直是具有挑战性的研究热点之一。如今我们面对的信息库由成前上万个异构信
随着计算机技术的发展和网络的普及,利用计算机或以计算机为目标的犯罪事件频繁发生。如何最大限度地获取计算机犯罪相关的电子证据,将犯罪分子绳之以法,政法机关在利用高技
随着互联网的快速发展,电子商务系统的规模越来越庞大,给人们带来了快捷和方便,但是这种便利性同时也带来信息过载的问题。推荐系统作为信息过滤技术中非常重要的一种方法,能够有
随着计算机和互联网技术的发展,国内公司企业信息化的深化,电子文档在企业内部网和电子政务网中使用广泛,很多机密文件都以电子文档的形式分发和存储。由于电子文档易于编辑
本文以“基于GIS的苏州消防应急系统的开发与设计”项目为背景。该系统是为城市安全建设、规划、管理以及应急救援、事故、灾害等紧急状况提供信息和服务的地理信息系统。根
随着WEB2.0技术及微博平台的迅猛发展,发布中文微博逐渐成为很多人的一种生活方式和习惯。通过分析微博观点句,个体消费者可以参考其他购买了产品或服务的用户的感受和观点做
蓝牙是一种低功耗的近距离无线通信技术,作为无线数据和语音通信的开放性标准,目的是取代现有的PC、打印机和移动电话等设备上的连线。蓝牙技术一经提出,立即受到业界广泛关
近些年,细分方法成为了几何造型领域最活跃的研究热点之一。随着人们在细分领域的不断开拓和研究,在细分的连续性理论、多分辨率表示、非正则规则的构造技术等方面,人们已取得了
基于支持向量机的图像检索,是一个有望用较少的图像样本,取得较好的检索效果的检索手段。借助支持向量机强大的学习能力,研究低层视觉特征和高层语义概念之间的关联,从而实现将高
火灾探测技术是火灾科学领域研究的热点,已取得不错的研究成果。传统火灾探测技术在保护人们生命和财产安全方面起到了非常重要的作用,但在大空间、室外等场所暴露出种种的不足