基于图像内容的文档检索方法研究

来源 :延边大学 | 被引量 : 0次 | 上传用户:heshuai6212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球信息技术的飞速发展,文档数量急剧增加,人们的查询需求日益多样化,传统的文档检索系统已经不能满足用户需求,因此文档检索的研究具有重要的研究意义和广泛的应用价值。全球的语言种类繁多,在用户没有明确的检索线索的情况下,如何进行有效的检索就成为了信息检索面临的崭新的研究课题。本学位论文将图像检索技术运用于文档检索系统中,提出了一种针对图像内容的文档检索方法。首先,提出了版面分析过程中的图像分割方法。舍弃版面分析提取的文字部分,基于游程熵的显著差异来分割出文档中的图片。该方法先计算文档图像每行的游程熵,然后利用图片与文字之间游程熵的差异,使图片区域与高游程熵对应,有效地提取出了文档中的图片。提出基于多特征图像检索算法,通过数字图像的位平面信息,选取重要位平面并计算直方图作为第一特征;然后计算位平面的局部颜色密度,并计算局部的颜色密度熵作为第二特征;最后计算位平面的全局平滑度作为第三个特征,并结合三种特征进行基于图像内容的检索。最后,结合版面分析分割出的图片,把每一幅图像的来源记录在关联数据库中,并计算图片的三种特征,构造特征库,最终通过图像检索结果来判断图像的出处并输出检索的文档结果。实验结果表明,本文提出的图文分割与图像检索方法可靠而有效,精确度与稳定性满足实用需求。另外,本文将位平面作为主要特征源,对抗噪声的攻击能力很强,运算速度快,适用于实用文档检索,而且为图像语义特征的研究进行了有益的探索。
其他文献
本论文针对VoD应用的特点,充分利用Maze[1]系统的资源优势,在Maze系统的基础上设计并实现了一个能够有效降低数据源服务器负载的P2PVoD系统,即MazeVoD系统。MazeVoD系统的主要特
图像不变局部特征是新近兴起的一类图像特征,基于不变局部特征的图像表示是计算机视觉的热点研究问题,在理论研究和实际应用上都具有重要意义。本论文针对图像不变局部特征的原
二十世纪六十年代,遥感技术作为一门新兴的综合性探测技术蓬勃发展起来。而遥感图像处理技术的研究是遥感技术中的一项十分重要的内容。由于成像设备硬件制造技术方面的原因,使得所获取的数字图像是地面信息的欠采样,从而得不到理想的高分辨率的图像。另一方面,由于光照大气及平台和地球之间的相对运动,也使成像产生模糊和降质,降低图像分辨率。提高遥感图像的分辨率一直是人们追求的目标,实现这一目标的有效途径之一便是采用
点云拼接是逆向工程、文物数字化、三维视觉信息处理中数据处理的重要内容,在逆向工程中要求更高的点云配准精度、文物数字化要求完整点云信息;以及计算机视觉中需要更快速的三
为了加强货运安全,铁路货运部门正在加快建设货运安全保障体系,其中货运计量、危险货物运输、规章文电等专项系统已经建成并得到推广应用,但是各专项系统相互独立,尚未形成统一的
电子政务已受到国家的高度重视,同时社会对电子政务系统的功能和性能的要求也日益提高。当前大量的电子政务系统多为B/S模式的Web应用程序,但在不同程度上存在着可扩展性差、互
随着World Wide Web的不断发展,网络上在线可用的数据库越来越多,这种在Web中只能通过查询接口访问的在线数据库被称为Web数据库。然而,随着Web数据库中所蕴含信息量的逐渐增加,
功耗建模与评测是现代低功耗设计的基础。由于芯片设计规模的增长,进行快速的门级功耗评测成为设计流程中的重要问题。同时,在设计周期的前端进行高层次功耗建模与分析,逐渐成为
学位
为适应国家实施投资体制改革的新要求,实现对全社会固定资产投资的全口径管理,提高政府部门间的协同办公能力和决策的科学性,更好地为国民经济建设服务,建设基于J2EE和ESB技术的
随着计算机的日益普及和网络覆盖率的扩大,计算机病毒的种类及病毒的变种越来越多,造成的危害也越来越大。随着病毒变种的出现,传统的计算机病毒检测方法的检测效率大幅降低。针