基于多线索融合的互联网图像搜索引擎关键技术研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:xincqu923
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的发展和网络带宽的提高,互联网上的图像资源变得越来越丰富,它们被大量的内嵌在HTML网页中,构成了一个庞大的“互联网图像库”。信息量的庞大和纷繁复杂使互联网图像检索技术变得十分重要,而目前图像检索的瓶颈问题是如何准确识别图像的语义。基于内容的图像检索在利用图像底层特征逼近语义上仍存在很大的鸿沟,而使用人工标注则费时费力。需要注意的是,与普通的图像库不同,互联网环境为图像提供了多线索的语义支持,例如图像所处网页的网页结构、环绕文本、链接信息等。然而,目前的搜索引擎未能很好的融合利用这些线索,从而给出较低的查准率和查全率。另外,目前的搜索引擎没有对返回结果进行有效的归类,给用户的使用造成不便。本文对互联网图像搜索引擎的关键技术进行了拓展性研究,重点研究了多线索融合的图像标注技术和基于谱聚类算法的分类技术,并实现了一个互联网图像搜索系统ISearch。这些技术对于解决互联网搜索引擎和类似信息库的分析与检索问题有一定的价值。 本文首先介绍了研究背景,简述了现有技术与不足,并概括了本文的主要工作。 在第二章中,综述了图像检索的研究状况,包括相关技术和典型系统。 在第三章中,介绍了基于各种线索的图像标注方法,然后对融合多线索的网页图像标注技术作出探讨。 在第四章中,讨论了利用谱聚类对网页图像进行分类的方法,介绍了谱聚类方法涉及的网页图像向量化、降维算法和聚类算法。 在第五章中,实现了一种基于互联网图像标注和分类的图像搜索系统ISearch,在本章中对其系统架构和实现技术进行了介绍,并给出实验结果。 在第六章中我们对全文作了总结,讨论了本文所述技术的应用前景和未来的研究方向。
其他文献
网格做为分布式计算的新兴分支,被认为是下一代互联网。网格利用Internet上广泛分布的大量闲置资源来解决大规模分布计算和应用的问题,在分布、异构和自治的网络环境下构建资源
近年来,随着人们对摆脱有线网络束缚、随时随地可以进行自由通信的渴望,无线网络通信得到了迅速的发展。但是,目前的移动通信大多需要有线基础设施(如基站)的支持才能实现。
红外热象仪在军事和商业上应用广泛。非制冷红外图像采集系统作为热象仪的关键部分,以其价格低、可靠性高、体积小、功耗低等优势在红外热成像系统的发展中占据着重要地位。本
随着互联网的持续发展,人们对网络中内容的需求越来越大。当前基于TCP/IP的网络架构在网络控制、资源分配等方面的问题日益突出,互联网的重心已经从主机与主机之间的通信转移
随着科技的发展,计算机的计算能力越来越强,计算速度越来越快,但人类对高性能计算的需求也越来越高。除了增强处理器本身的计算能力外,并行处理是一种提高计算能力的有效手段
在网络多媒体通信中,视频压缩和传输技术起着越来越重要的作用。近些年来,许多视频压缩国际标准相继被提出,如MPEG系列标准和H.26x系列标准,它们被广泛应用于数字广播电视标
WebService技术框架具有完全的平台、语言的独立性和更高程度的抽象,用户只要遵守WebService的接口即可进行服务的请求与调用。基于Web服务的统一身份认证系统是指利用一个集
IMS(IPMultimediaSubsystem)是3GPP在Release5版本提出的支持IP多媒体业务的子系统,它的核心特点是采用SIP协议和与接入的无关性。在网络融合的发展趋势下,3GPP、ETSI和ITU-T都
医学图像分割问题一直是图像处理领域中的经典难题。大脑组织具有特别复杂的结构,为了得到脑部病变组织的尺寸、外观的量化信息和实现脑部结构的三维重构,脑组织图像分割显得
无线个人网络(WPN),作为一种新型的网络,由于其良好的性能特点和广泛的应用前景,正成为目前无线网络领域中研究的热点问题之一。在无线个人网络的诸多研究内容中,路由是保证无线