论文部分内容阅读
计算机技术和网络技术的发展以及多媒体技术的应用使WEB上图像的数量正以惊人的速度增长。图像的使用逐渐渗入到社会的各行各业,已成为大众化数字信息的一种重要形式,越来越多的人能够方便、快捷地接触到这些图像。与此同时,人们面临的问题不再是缺少图像,而是如何在浩如烟海的图像中挑选出自己需要的内容。因此,研究如何有效地组织、管理和检索大规模的WEB图像数据库,对未来互联网服务具有重要的理论和应用价值。本文在深入研究WEB图像检索的研究现状和应用领域的基础上,分析了建立科技论文图像检索系统的必要性。在这一部分,文中首先提出了一种基于分割的PDF文档图像提取方法,该方法可以有效的提取PDF文档中的图像,而且有较高的准确率和很好的通用性;然后提取了科技论文的标题、摘要、关键词、周边文本,使用它们的不同组合为提取的图像建立索引,并测试了使用不同的文本内容索引图像时的检索效果:最后建立了一个基于文本的科技论文图像检索的原型系统,该系统是对现有的科技论文检索系统功能的很好的补充。另外,在深入研究了WEB图像检索与分类的研究现状及关键技术并分析了大量网页源代码的基础上,针对WEB图像检索与分类过程中如何有效利用HTML页面中的文本信息的问题,提出了一种基于规则的WEB图像元数据提取方法,并在一个包含大量门户网站新闻网页的网页集上对该方法进行了测试。实验证明用该方法建立的WEB图像元数据描述具有描述性好、噪音少的特点。在此基础上,文中提出了一种综合MPEG-7颜色描述符和元数据的WEB图像分类方法。该方法将图像内容特征与图像文本特征进行了统一量化。实验证明,图像的内容特征和文本特征可以实现很好的互补,两种特征的结合对于提高WEB图像分类的效果有很大的帮助。同时,该实验也间接证明了文中所提出的基于规则的WEB图像元数据提取方法的有效性。