论文部分内容阅读
随着计算机网络、流媒体技术、存储技术等高新技术的蓬勃发展,数字出版已经成为新闻出版业发展的主要方向。同时,数字出版带来的知识产权保护问题引起了社会的广泛关注。数字出版物中图像的侵权问题审查成为知识产权保护的主要任务之一。然而,从一个巨大的有版权的图像库中检索出与审查图像高度相似的图像是困难的,特别是当这项工作主要依赖于耗时和易出错的人工操作时。因此,智能化的数字出版物中图像侵权检测技术的研究与开发具有重要的理论价值和现实意义。本文的研究,旨在检测数字出版物中图像是否存在侵权行为,即检测数字出版物中是否存在非法、恶意引用已有版权图像或其变形图像的行为。以此为背景,本文重点研究了用于数字出版物中图像侵权审查的图像检索算法。本文的研究内容主要包括以下几个部分: 首先,本文深入研究了英属哥伦比亚大学David Lowe教授提出的经典SIFT算法及GLOH、PCA-SIFT、CSIFT、ASIFT等改进SIFT算法。将SIFT算法分为图像尺度空间生成、特征点检测与精确定位、特征点方向计算、特征点描述子生成、特征点搜索与匹配共五个步骤进行详细分析。并设计图像检索对比实验,比较了SIFT算法和PCA-SIFT、SURF、CSIFT三个改进SIFT算法的检索性能,验证了将SIFT算法选为本文图像检索研究基础算法的可行性。 其次,本文提出了一种基于特征点分布规律与双检索策略的改进SIFT检索算法。该算法提出了在图像特征提取过程中加入SIFT特征点分布信息的思路,增强了图像特征的可描述性和代表性;并在传统SIFT特征点搜索与匹配步骤之前创新性地增加了特征点预处理过程,提升了特征点搜索速度和匹配准确度。另外,该算法还设计了“粗检索-精检索”的双检索策略,降低了传统SIFT算法的检索复杂度,减少了检索时间。在粗检索过程中,该算法改进传统的地理统计(Geographical Statistics,GeoStat)方法来描述图像特征点的分布规律,并利用图像特征点分布规律的相似程度来衡量图像间的相似程度。在粗检索的基础上,该算法利用增加特征点预处理的SIFT特征点搜索与匹配步骤,对图像间高度相似的的特征点描述子进行搜索与匹配。并将图像间的特征点匹配对数目作为图像间相似度的衡量标准,完成对粗检索结果的进一步精细检索。实验结果表明,本改进算法的每张图像的平均检索时间仅为原始SIFT算法的11.18%;同时,本改进算法的检索查全率和查准率较原始SIFT算法都有一定程度的提升。 第三,本文提出了一种基于特征点颜色信息与双匹配策略的改进SIFT检索算法。该算法提出在图像特征提取过程中加入SIFT特征点的邻域颜色信息来增强特征点匹配的可靠性。另外,该算法还设计了图像特征点“初次匹配-二次匹配”的双匹配策略,降低了特征点错误匹配的概率。在特征点初次匹配过程中,该算法利用传统SIFT特征点搜索与匹配步骤,对图像间高度相似的特征点描述子进行搜索与匹配,并将匹配成功的特征点对保存到候选特征点匹配对集合中。对于每个候选特征点匹配对,该算法计算候选特征点间颜色信息的相似度。若两个特征点的颜色信息的相似度很高,就二次判定该特征点匹配对是正确的匹配对。并将二次判定的图像间的特征点匹配对的数目作为图像相似度判定的依据。图像间的特征点匹配对越多,图像间的相似程度越高。实验结果表明,与原始SIFT算法相比,本改进算法的检索准确度更高,达到了改进SIFT算法的目的。 最后,基于上述研究内容,本文将图像检索算法应用于数字出版物图片侵权审查这一新领域。