隐马尔可夫模型的研究及其在图像识别中的应用

被引量 : 0次 | 上传用户:QQainigirl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别技术在生产生活中有着十分广泛的应用,复杂图像的识别问题一直是近年来模式识别和图像处理研究的热点。本文基于隐马尔可夫模型进行图像识别问题的研究。如何将已经在语音识别领域取得了广泛应用的隐马尔可夫模型成功引入到图像识别中来是近年来相关研究讨论的热点。本文认为,针对不同对象建立合适的伪二维隐马尔可夫模型是目前最可行和有效的方法。本文首先提出了一种适用于脱机手写体汉字识别的嵌套伪二维隐马尔可夫模型。嵌套伪二维结构是对二维结构的一种合理简化,而这种简化是基于对汉字结构的深入分析以及对邻点和邻域相关性的全面考察。这种模型在国标一级汉字字库上具有91.8%和95.2%的一选和十选识别率。本文对人脸识别问题进行了类似的研究,并提出了一种简化伪二维隐马尔可夫模型。这种模型在ORL人脸库上具有99.5%的识别率,而复杂度比已有的人脸隐马尔可夫模型小。针对隐马尔可夫模型在上述的具体应用中出现的问题,本文提出经典隐马尔可夫模型理论具有状态集固定的缺陷。这种缺陷影响了隐马尔可夫模型对随机信号建模的能力,并限制了基于隐马尔可夫模型的分类器的性能。因此,本文提出了一种全新的自适应隐马尔可夫模型,可表示为θ(N,A,B,π)。它具有可变的状态集,目的是为了自动匹配信号的“真正”隐含状态集,提取更多的结构信息。它采用了一种基于确定性退火全局优化技术的收缩训练算法,这种算法以最大后验概率为优化标准。实验结果表明该自适应模型具有理论和实践上的双重意义:更符合信号的内在结构,能提取更多的结构信息,可提高隐马尔可夫模型对随机信号建模的能力和在复杂图像识别应用中的性能。本文提出的嵌套伪二维隐马尔可夫模型经过自适应改造后可使脱机手写体汉字的一选和十选识别率分别提高到95.9%和99.0%。
其他文献
论文主要论述了二十世纪前期上海的设计艺术发展背景、设计艺术团体、设计艺术教育状况、设计艺术风格以及人们的审美取向对当时上海设计艺术的影响。研究主要涉及二十世纪前
财务资源是企业生存和发展的基础性资源,对企业提升核心竞争力和持续发展起着重要的支撑作用。以中小企业为基点,就企业财务资源配置中的问题、配置目标、优化途径以及财务资
魏晋时期,佛学般若学与中国美学的历史交遇,是促成中国美学体系发生深刻转型的重要动因。魏晋般若范畴以印度宗教,尤其是佛教大乘般若学为文化渊源,原具有十分独特、丰富的美学蕴
<正> 1980年在涧西区拖拉机厂前修路时发现一座晋墓,在挖土时墓形已被破坏。在这座晋墓中出文物有:两件鼓腹四系陶罐,一件瓷鸡头壶(见图),十二枚五铢铜钱。这些文物现已送交
期刊
产品开发是创造社会物质文明的重要源动力,人类文明的进步又促进了产品开发方式的不断演变。计算机支持的协同产品开发代表了现代产品开发的发展趋势,它是信息化社会下群体协作
<正> 随着科学技术和工业生产的发展,化工行业中新化学物不断涌现。人们常需了解化学物的毒性,毒理学中半数致死剂量(LD50)或LC50)这一指标的应用十分普遍,因此有必要对LD50的
<正>《义务教育语文课程标准》指出语文学科的性质是"工具性与人文性的统一,是语文课程的基本特点",从国家政策层面上结束了语文学科性质长期纷争的局面,但是语文教育界对语
为反映北京居民幸福水平,本文在对北京1700多常住居民调查的基础上,编制了居民幸福指数。并引入隐变量结构方程模型,利用ML方法找出影响北京居民幸福感的主要因素。
多杀性巴氏杆菌(Pasteurella multocida,Pm)是一种重要的病原菌,按产毒素与否,可将其分为非产毒素多杀性巴氏杆菌(Non-toxingenic Pasteurella multocida,TPm)和产毒素多杀性巴氏
<正>一、企业并购风险及风险因素分析(一)企业并购风险函义企业并购是兼并与收购的合称,在西方,两者按惯例联用为一个术语--Merger&Acquisition,简称M&A。兼并泛指两家或两家