非负矩阵分解方法及其在选票图像识别中的应用

被引量 : 13次 | 上传用户:okmijnuhbygvtfcrdx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别是随着计算机技术发展而兴起的。它利用计算机对图像进行处理,以识别各种不同模式的目标和对象,是图像融合、立体视觉、运动分析等实用技术的基础。近年来,随着图像识别技术在自然资源分析、生理病变、天气预报、导航、地图与地形配准、环境监测等领域的广泛应用,各种理论和方法也被大量应用到图像识别中,非负矩阵分解(Non-negative Matrix Factorization, NMF)理论就是其中之一,是当今的研究热点。NMF是从“对整体的感知由对组成整体的部分感知构成”观点出发而构建的。它将一个非负矩阵分解为两个非负矩阵的乘积,原矩阵中的一列可以解释为基矩阵中所有列向量的加权和,而权重系数为权重矩阵中对应列向量中的元素。这样基于向量组合的分解具有可解释性和明确的物理意义,而且占用存储空间更少,是一个处理非负数据的强大工具。从模式识别角度来看,NMF实质上是一种子空间分析方法,其本质是一种特征提取和选择的方法。NMF的主要思想是在样本空间中寻找合适的子空间(特征子空间),通过将高维样本投影到低维子空间上,从而在子空间上获得样本的本质特征,利用这些特征实现分类。作为一项数据处理技术,NMF揭示了描述数据的本质,已经被广泛应用到人脸检测与识别、图像融合、图像检索、图像分类、图像复原、图像压缩、灰度图像的数字水印、文本分析与聚类、语音识别、生物医学工程、网络安全的入侵检测等诸多方面的研究中。本文在非负矩阵分解理论方面进行深入研究。首先,基于Frobenius范数和Kullback-Leibler散度的两个目标函数,利用Taylor展开式、稳定点求解和Newton求根公式,提出了一种非负矩阵分解的理论分析方法;然后,利用该方法,严格导出了三种非负矩阵分解方法,解决了相关问题。最后,将结构模式识别方法和本文的非负矩阵分解方法应用到选票图像中的特殊手写符号识别,详细给出了选票图像识别方法。本文的主要贡献有以下几个方面:1.提出了非负矩阵分解新方法根据Frobenius范数‖X-WH‖F2和Kullback-Leibler散度D(X‖WH),提出了一种新的非负矩阵分解(Novel Non-negative Matrix Factorization, NNMF)方法。从理论上严格推导了非负矩阵分解中基矩阵和权重矩阵的迭代公式,算法推导方法是新颖的。证明了算法的收敛性。给出了算法步骤。与标准NMF方法比较,本文的方法更容易找到辅助函数,从而更容易确定迭代公式。当使用Frobenius范数作为目标函数时,可以得到与标准NMF完全相同的迭代公式。当使用Kullback-Leibler散度作为口标函数时,获得了一组新的迭代公式;在人脸识别实验中,当收敛精度不是很高时,基矩阵的列基取不同值的大部分情况下,相对于相应的标准NMF算法,该算法具有较高的识别率。2.提出了近似正交非负矩阵分解方法将Frobenius范数和近似正交约束作为目标函数,提出了近似正交非负矩阵分解(Approximate Orthogonal Non-negative Matrix Factorization, AONMF)方法。利用Taylor展开式和稳定点求解方法,严格导出了非负矩阵分解的基矩阵和权重矩阵的迭代更新算法,并证明了算法的收敛性、阐述了基矩阵近似正交的理由。人脸识别结果表明:只要基矩阵的秩选择恰当,识别率是较高的。3.提出了收敛投影非负矩阵分解方法为了解决投影非负矩阵分解(Projective Non-negative Matrix Factorization, P-NMF)算法的收敛性问题,提出了收敛投影非负矩阵分解(Convergent Projective Non-negative Matrix Factorization, CP-NMF)方法。分别利用Frobenius范数和Kullback-Leibler散度作为目标函数,利用Taylor展开式和Newton迭代求根公式,严格导出了投影非负矩阵分解的基矩阵迭代算法,并证明了算法的收敛性。实验结果表明:该算法具有较快的收敛速度,而基矩阵的初值会影响收敛速度;相对于标准NMF,该方法的基矩阵具有更好的正交性和稀疏性,但数据重建结果说明基矩阵仍然是近似正交的;人脸识别结果表明该方法具有较高的识别率。4.提出了线性投影非负矩阵分解方法针对基于线性投影结构的非负矩阵分解(Linear Projection-Based Non-negative Matrix Factorization, LPBNMF)迭代方法比较复杂的问题,提出了线性投影非负矩阵分解(Linear Projective Non-negative Matrix Factorization, LP-NMF)方法。从投影和线性变换角度出发,将Frobenius范数作为目标函数,利用’Taylor展开式和稳定点求解方法,严格导出了基矩阵和线性变换矩阵的迭代算法,并证明了算法的收敛性。实验结果表明:该算法是收敛的;相对于一些非负矩阵分解方法,该方法的基矩阵具有更好的正交性和稀疏性;人脸识别结果说明该方法具有较高的识别率。5.提出了选票图像识别方法选票图像中的特殊手写符号通常是:勾“√”、圈“O”、叉“×”、杠“、一、/(三种写法)”。为了解决基于光学字符识另(?)(Optical Character Recognition,OCR)技术的选举投票系统中手写符号图像的快速定位与识别问题,提出了选票图像识别方法。该方法在充分考虑选举信息的基础上,实现了选票的可视化设计。该选票设计记录了选举信息中相关对象的位置数据。利用这些数据,将选票图像预处理后,找到一个确定的参考点,再提取选票设计中的位置数据,将它转化为相对于这个参考点的图像位置,利用该位置搜索表格线,从而确定要识别图像的准确位置;基于该位置,可截取手写符号图像,对该图像进行一系列处理后,提取其结构特征,采用结构模式识别方法识别。如果结构特征无法判别,就采用本文的NMF方法进行新的特征提取后再识别。实验结果表明,这种方法的定位速度快、识别率高。结合选票设计的识别方法使得识别软件定位速度更快、选票版面可以更复杂,采用结构模式识别和NMF相结合的方法识别准确率更高,有效提高了系统效率,选举投票系统更加完善。
其他文献
2008年以来,为解决小微企业融资难的问题,国家先后出台了多项政策措施,但小微企业的融资需求仍旧得不到满足。小微企业数量庞大,拥有着广阔的市场,是商业银行的重要客户群体
随着高科技的发展,图像为人们记录了越来越多的信息,这些信息涉及到工作、生活等方方面面,图像识别因此逐渐成为人们在模式识别领域中所重点关注的方向。基于图特征的图像识
统筹城乡发展,必须减少农民,富裕农民。加快推进城镇化是解决农业农村和农民问题的根本途径,实现农村富余劳动力的就地转移,是使农民脱贫致富的关键所在,也是未来发展工业化和现代
针对当前学生对生物实验室安全知识的缺乏及对安全事件防范意识不强的现状,提出以互联网+微课形式对学生进行生物实验室安全教育,并对生物实验室安全教育微课体系建设进行详
复方黄黛片由国医大师黄世林发明,组方为雄黄、青黛、丹参和太子参,临床用于治疗急性粒细胞白血病,取得非常显著的疗效。因方中含确有疗效的"有毒"中药雄黄,其安全性问题一直
大型汽轮发电机转子的抽出与穿进是火电厂A级检修的重大工作,具有技术难度高、作业风险大、配合专业人员多等特点,尤其对行车驾驶员的技术水平有着极高的要求。本文根据作者自
<正>江苏黑松林粘合剂厂有限公司虽是一家小企业,却是"全国企业文化建设先进单位""中国化工企业文化建设十佳示范单位",企业人均产值超过百万元。作为"心力管理"的创始者,董
西方的叙事学从20世纪80年代开始登陆中国,90年代始,国内叙事学家开始根据经典叙事学的理论,参照中国的叙事实践,融合国外叙事学家的理论,撰写自己的叙事学著作。这些著作立
活跃在伪满文坛上的牛岛春子于1938年和1942年写出了小说《雪空》《女人》和《福寿草》。以日本人为主人公的这三篇作品与作者有着一层相对特殊的关系。从身为转向者的《雪空
刑事诉讼法上所保障的辩护权不仅是指在形式上赋予被追诉人自行辩护权和聘请律师作为辩护人的权利,而且要求在委托辩护的情形中,辩护律师必须积极地参与刑事诉讼,为被追诉人