【摘 要】
:
骨架是穿过数据分布中心的像素点集合,是一种重要的形状特征。该特征在保持形状的拓扑和几何性质的同时还能有效的降低计算复杂度。虽然,骨架提取领域已经取得了诸多的研究成果
论文部分内容阅读
骨架是穿过数据分布中心的像素点集合,是一种重要的形状特征。该特征在保持形状的拓扑和几何性质的同时还能有效的降低计算复杂度。虽然,骨架提取领域已经取得了诸多的研究成果,但是,现有的骨架提取算法仍然存在一些挑战。例如大部分算法所提取的骨架与人类视觉差距较大;特别是当形状存在模糊、扭曲以及稀疏、间断等复杂情况时骨架提取效果较差;现有的骨架提取算法难以向高维扩展。
主曲线(principalcurves)是满足“自相合”并且穿过数据分布“中间”的光滑曲线,即该曲线可以理解为能够反映数据集合拓扑结构的“骨架”。基于此,本论文提出了一种基于主曲线的骨架提取算法,用于提取低质手写体汉字骨架。该算法采用类似于自动聚类算法的思路,增量的寻找每个voronoi区域中的第一主成份线段,通过代价函数连接所得的K段主成分线段从而构造初始哈密尔顿路径。当然这里所得的是局部意义上的一条次优哈密尔顿路径,因此,我们提出了一种简单方法用于优化初始哈密尔顿路径,得到更具有全局最优性的汉字骨架。另外,由于这里是用一条哈密尔顿路径去逼近汉字骨架,因此我们还提出了一种基于全局的平均稀疏度来设定阈值的简单后处理策略,从而删除冗余边集,得到符合人类视觉的汉字骨架。
经过了大量Matlab实验证明,该方法对带模糊、扭曲、断裂、稀疏的低质手写体汉字均取得了很好效果。另外通过对图像背景中添加噪音,也能够得到连续的、完整的汉字骨架。我们还尝试进行了将2-3个自由手写体汉字作为一个整体进行骨架提取,也取得了较为理想的效果。
无疑,本文提出的方法不仅对于低质汉字骨架提取是可行的,而且是鲁棒性非常好的一种新方法,也为汉字骨架提取研究提供了一条新思路。
其他文献
信息时代伴随着人们知识的增长,图书馆的规模和藏书量也在快速增长,这给图书管理工作带来了新的挑战和机遇。目前,通过传统的分类方法可以解决大量藏书的分类查找问题,但由于图书
专家系统是一个具有大量专门知识的程序系统,主要包括知识库、数据库、推理机制、解释机制、人机接口和知识获取等功能模块。它能根据一个或多个专家提供的特殊领域知识进行
随着互联网的快速发展及数字化设备的普及,多媒体数据的数量正在飞速增长,音频数据作为多媒体数据的重要组成部分,其信息量也在不断膨胀。传统的基于文本的信息检索无法满足
随着计算机网络广泛应用,互联网上的安全和隐私越来越受到人们的关注。可以很好地隐藏通信关系的匿名通信技术得到快速发展,成为网络安全研究人员的研究热点。近年来,随着P2P
语义网(Semantic Web)是万维网的本质变革,它是由万维网的创始人TimBerners-Lee提出的。语义网上的信息被赋予了明确、清晰的含义,便于人和计算机之间的协作。然而,语义网本
业务流程的设计和验证是所有工作流产品的一个主要功能。为了能够尽早发现流程建模中死锁、缺少同步等问题,大部分工作流产品都需要提供基于形式化分析和建模的功能。由于WS-
当前中国餐饮业的普遍管理模式是原始的手工点菜、结账方式,这种方式已完全无法跟上当前信息化高速发展的步伐,也已无法满足消费者对于方便性,快捷性,个性化,服务质量的更高
随着Internet的普及和发展,越来越多的企业采用基于Web模式的系统作为企业信息发布、交换、管理、交易的平台。这种基于Browse/Server结构的Web应用开发技术,能够降低企业开
随着计算机技术的快速发展,各种各样的有线或无线网络把人们紧密的连接在一起。作为一种极具竞争力的无线接入技术,WiMAX成为众多运营商关注的焦点,并着力将其推向市场。然而
高光谱遥感技术在地球科学领域应用广泛,并取得了巨大的成功,矿产资源探测是其在地质勘测领域重要的应用之一。但高光谱遥感数据规模大、计算复杂度高,实际应用中的数据处理