基于局部特征的维吾尔文印刷体文档图像检索技术的研究

来源 :新疆大学 | 被引量 : 0次 | 上传用户:gideonkim
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着文档图像处理技术、图像采集技术和多媒体技术的不断发展,文档图像因具有易于收集、获取和携带方便、内容丰富、应用范围广泛等特点已成为人们日常生活和工作中不可缺少的信息获取来源。近20年以来,文档图像在档案管理、政府办公文件管理、数字图书馆管理等方面得到了广泛的应用,逐渐成为信息处理领域中发展速度最快的研究内容之一。随着文档图像应用的范围的越来越广泛和文档图像数量的不断增加,文档图像检索技术引起了许多研究者们的关注。而且如何从大量的文档图像数据库中精确和快速的搜索出有关信息成为迫切需要处理的紧要问题。  文档图像检索是指根据输入的文档图像,从文档图像数据库中找出与输入文档图像相似或近似的目标文档图像。目前提出的文档图像检索技术中大部分利用文档图像的纹理、形状和空间关系等全局特征,对文档图像进行检索操作。然而,基于这些全局特征的检索系统无法精确的表达出文档图像的细节内容,特征匹配和检索效率也不能满足要求。尤其是对于只包含文字的纯文本图像来说,通过基于全局特征的检索方法来进行文档图像检索的效果很不好。因此,本文提出了基于局部特征的文档图像检索方法。  本文的实验内容主要包括以下几个部分:  (1)首先对文档图像检索技术中的特征提取、特征点匹配和图像检索部分进行了详细的研究,通过从每个图像的各个特征点提取128维的特征向量,并使用最近和次近欧氏距离的比值来度量相似性,初步建立了基于SIFT特征的维吾尔文文档图像检索系统。然后对SIFT的特征提取部分中的特征描述子生成进行了改进,将高维的特征向量减少为36维的特征向量,并使用最近和次近欧氏距离的比值来度量相似性,提出了以降低特征向量维数为目的的基于PCA-SIFT特征的文档图像检索系统。  (2)由于基于欧式距离比值的检索系统中检索性能的好坏由阈值来决定,因此为了避免维吾尔文文档图像检索系统中因阈值的选定不恰当而降低检索效率,本文中对图像检索策略进行了改进,把 KD树最近邻搜索方法与 SIFT和PCA-SIFT特征相结合,进一步提出了基于SIFT特征和KD树最近邻搜索方法的文档图像检索系统和基于PCA-SIFT特征和KD树最近邻搜索方法的文档图像检索系统,并比较这四种检索系统的特征点匹配率、图像检索率等性能,确定最适合维吾尔文印刷体文档的文档图像检索系统。  (3)为了验证SIFT特征提取算法对亮度的、旋转的、尺度不变性的维吾尔文文档图像的特征点提取性能和文档图像检索方面的有效性,本文在基于SIFT特征和 KD树最近邻搜索方法的检索系统中,对划分的、亮化的、旋转的和倾斜的查询图进行特征点匹配和图像检索实验,得到了100%的检索效率。  (4)在查询图像不在数据库的情况下进行特征点匹配和图像检索实验,算出了数据库不包含的查询图像和数据库里面的所有文档图像之间的相似率。  通过对包括2000幅维吾尔文文档图像的数据库进行文档图像检索实验,本文证明了基于SIFT特征+KD树最近邻搜索的检索系统对维吾尔文的文档图像检索具有更好的有效性和应用价值。
其他文献
随着信息化高速发展和普及,人们越来越依赖于计算机和互联网络。如果计算机网络系统的安全受到危害,将会给我们的生活带来严重的影响。因此,信息安全已经成为全社会关注的焦
说话人识别就是能够让机器分辨出不同人的声音来,主要是以语音信号为研究对象,它由特征提取和模式识别两大部分组成;其中,如何高效地找到区别不同说话人之间的个性特征一直以
近年来,随着社会信息化进程的加快,无线通信技术飞速发展,我国提出了TD-SCDMA标准,成为具有自主知识产权的三大主流标准之一,它的提出在中国通信史上具有突破性的意义。与第二代移
随着3G网络的日趋完善,业务的不断推陈出新,多媒体业务和高速数据业务必将成为联通业务发展的新重点。目前,WCDMA网络的维护手段主要包括信令测试仪表和信令集中监测系统。信令
随着移动通信技术的不断发展,移动终端平台的不断更新换代,移动办公已经成为越来越多人的首选。另一方面,人们对移动办公不断增长的需求,也促进着移动终端功能的不断完善。而
在工业生产过程中,往往需对现场数据进行实时检测和处理,传统的数据采集大多采用有线数据传输方式。由于传统有线网络本身的局限性,要解决很多特殊环境下的网络覆盖和网络支
多天线系统(MIMO)能在不牺牲额外带宽的前提下,大幅度提高系统的信道容量和频谱利用率。空时编码技术则能通过MIMO信道获得分集增益,进而改善无线通信系统的可靠性。但是根据
随着通信网络技术的飞速发展,我国的通信网络规模不断扩展,通信体系也不断向前推进。3G牌照发放以后,原来的GSM、GPRS系统不断向UMTS方向演进。可支持的业务内容越来越丰富多彩,
在工业生产和科学研究等众多领域都要求对温度进行测量。传统的温度测量方法是采用热电阻或热电偶。这些接触式测温方法虽然具有简单、可靠、精度高等特点,但是需要温度探测器与被测物体直接接触进行热传导,直至热平衡之后方能测量出温度,而且这种方法只局限于中低温测量,对于较高的温度测量就不适用了。如果需要测量液体的温度,用于测温的探头多为一次性的,属易耗品,测温成本较高。除此之外,我们还需要对一些运动物体进行温
人脸作为行为人的重要标志,在情感传递和身份识别中起着重要作用。人脸识别以其非接触无侵犯性采集、友好、方便、可交互性等特点,在众多的生物特征识别技术中始终具有重要的