基于Hausdorff距离的古籍汉字图像检索

来源 :河北大学 | 被引量 : 0次 | 上传用户:PresentScore
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
古籍汉字数量多,结构复杂,现有的文字图像检索方法在应用于古籍汉字图像时难以取得理想的结果。为了更好地辅助从事古籍汉字研究的专家学者以更高的效率从事研究工作,本文根据古籍汉字的特点,研究、设计并实现了一种基于Hausdorff距离的古籍汉字图像检索系统。在对国内外文字图像检索相关理论和技术的发展状况进行介绍与分析的基础上,论述了古籍汉字图像检索系统各个关键模块的设计与实现过程。首先,针对古籍汉字图像存在的噪声问题,采用腐蚀算法对古籍汉字版面图像进行去噪;然后,利用连通区域标记算法搜索得到古籍汉字版面图像的连通区域,并对其进行合并得到古籍汉字的单字图像;在古籍汉字图像的检索特征选择与提取中,采用基于轮廓的特征提取方法,通过对Canny、Sobel、Prewitt等算子的比较,选择Canny算子进行边缘特征的提取;最后,在古籍汉字图像检索模型中,对提取出来的古籍汉字图像特征建立索引,采用基于Hausdorff距离的图像匹配算法,实现古籍汉字图像检索。实验结果表明,本文的方法能够有效地辅助古籍汉字研究人员的工作。
其他文献
随着汉语学习在世界范围内的推广,汉语教学的学科体系日渐成熟,教学理论日渐丰富,相关研究不断深入细化,课堂活动在汉语教学中的重要性也越来越多地被提及。针对课堂活动的调
作为物联网产业的核心技术,无线传感网络已被应用于生产生活的许多领域。无线传感网络往往被部署于复杂多变或干扰因素诸多的环境中,常会造成感知数据偏离实际,从而导致感知
随着计算机技术突飞猛进式的发展,不管是从硬件还是从软件上,都越来越能满足人们的需求。在计算机技术领域发展中,三维重建越来越成为机器视觉的研究重点,并在地图制图,建筑
近年来,随着多媒体技术飞速发展,越来越多的蒙古文古籍文献被扫描转化为数字图像,以便长久保存。这样做不仅有利于古籍文献的保存,同时也给相关研究人员提供了十分珍贵的研究
多标签分类问题一直是机器学习中的热点问题。在过去的研究中,人们解决该问题的关键在于如何建模标签之间的依赖关系,从而提升模型的性能。然而在本文中,笔者受到多视角学习
随着信息科学技术的发展,越来越多的数字化设备被应用于工作和生活中来记录和传播信息,进而使得照片和视频资源呈现几何级数的增长。如何快速从海量的视觉媒体信息中筛选出有
PLM(Product Lifecycle Management)系统,即产品生命周期管理系统。该系统能够管理从产品设计、产品生产、销售到停产整个生命周期的所有数据信息。它的最大特点就是能够实现
近年来随着人们对智能计算、物联网与人机交互等技术研究的日益深入,情景感知技术得到了快速发展。情景感知计算的目标在于实现“无时不在而又无处不在”地主动为用户提供恰
随着海量数据的出现,数据挖掘成为目前最有应用价值的领域之一,数据挖掘技术从这些大量的无结构的数据中提取有效的隐含价值的信息,从而提高决策效率。不平衡数据分类是数据
随着信息革命的不断推进,网络成为人们生活中不可或缺的一部分。敏感信息在网络上的安全传输问题关系着个人、企业乃至国家的发展。安全协议以密码算法为基础在互联网络中为