大类别集分类与自适应及其在汉字识别中的应用

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:qingdao2046
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
模式分类是机器学习和模式识别的核心问题,而特征表示和分类器设计又是模式分类的关键步骤。大量的特征提取方法以及分类器模型被相继提出并在实际问题中得以广泛应用。然而绝大多数的模型都是针对小类别集问题,并且需要满足独立同分布的假设。因而这些模型在实际问题中会有一定的局限性,例如对于汉字识别这样一个典型的大类别集问题,传统的Fisher线性判别分析降维会带来相似字类别混淆的问题,并且不同的书写人具有迥异的书写风格,因而打破了独立同分布的假设。本文从“大类别集”和“非独立同分布”的角度出发,分别从降维、分类器学习、分类器自适应三方面进行了深入的研究,并且在联机及脱机手写汉字识别上取得了优于传统方法的性能。本文的主要贡献如下:   (1)基于加权Fisher准则的大类别集降维方法。为了解决传统的Fisher线性判别分析在大类别集问题中的相似类别混淆问题,本文从加权Fisher准则的角度出发,对容易混淆的类别给予更大的权值,从而获得更优的降维子空间。本文充分比较了五种不同的加权函数以及三种加权空间,在此基础上提出一种非参数降维方法并在大类别集手写汉字识别中取得了最优性能。   (2)局部平滑的修正二次判别函数分类器。为了解决修正二次判别函数MQDF对训练数据的过拟合问题,本文提出一种基于局部平滑的修正二次判别函数LSMQDF,对每一个类的协方差矩阵与其邻近的其他类的协方差矩阵进行平滑处理。作为防止过拟合的正则项、同时也是对全局平滑方法的一种推广,LSMQDF取得了明显的泛化性能提升。   (3)基于风格迁移映射的分类器自适应。为了应对非独立同分布问题,本文提出一种基于风格迁移映射的分类器自适应方法。风格迁移映射是一个将“源点集”映射到“目标点集”的过程,其目标函数是一个凸的二次优化问题因而可以解析求解。风格迁移映射可以与不同的分类器结合并用于监督的、非监督的、及半监督的自适应。大类别集手写汉字识别实验表明,风格迁移映射可以取得显著的错误率下降。   (4)基于风格归一化的模式域(Pattern Field)分类。为了充分利用样本之间的风格一致性以提高分类精度,本文提出了一种基于风格归一化的模式域分类方法。通过对传统的贝叶斯决策方法进行扩展得到了一系列新的训练和决策准则。在多姿态人脸识别,多说话者语音识别,多书写人汉字识别上取得了优于传统方法的性能。
其他文献
该文内容主要有两部分,第一部分介绍了中国第一套独立开发的具有自主知识产权的柔性先进控制软件包FLACS(Flexible Advanced Control System)Ver1.0的组成、特点和应用情况.
随着人们生活水平的不断提高,人们对食品质量的要求也越来越高,红外光谱分析技术作为一种快速、准确、灵敏、实用的产品品质检测方法已经被分析人员所接受。红外光谱分析是光谱
该文在原有的智能决策系统结构的基础上,结合决策支持新技术提出了智能决策系统的新框架,并对实现此框架的各部分关键技术作了较为深入的研究,探讨了其实现的可能性.
多弧离子镀是在真空电弧和离子镀技术基础上发展起来的一种新式镀膜技术。近些年,随着其工艺的逐渐完善,以其离化率高、散射性好、膜层致密以及附着力强等优点,在冶金、机械加工
机器人作为20世纪人类最伟大的发明之一,代表了当今社会最先进的智能控制技术。仿人机器人作为系统结构最复杂、集成度最高、与人类最为相似的一类机器人,代表了最先进的机器
论文在分析了药芯焊丝拉丝机的机构、特点以及在拉制过程中影响焊丝张力因素的基础上,建立了各机架分部数学模型、机架间张力的数学模型和整机的数学模型.并在此基础上,分析
城市交通系统与城市发展息息相关,对人类文明演化起到不可替代的支撑作用。但近年来,随着大量人口向城市集中和城镇化进程不断加速,交通压力越来越大。而旧有的城市交通改善方法
该文对工业CT局部找描的重建算法及其在计算机上的实现进行了研究.论文介绍了研究背景,通过比较分析,定出了将平行束扫描方式下的局部图象重建作为课题的研究内容.
多任务学习用于同时学习多个相关任务,通过联合学习,它既保持了任务间的差异性又充分利用其相关性,从而从整体上提高所有任务的学习性能。多任务学习引起了很多学者的关注,基于不
基于图像的物体定位是计算机视觉领域的一个重要内容,在诸如机器人导航和虚拟现实等领域有重要的应用价值。本文对基于点对应的物体定位方法进行了比较系统的研究,包括多解性,解