基于网页信息和图像特征的Web图像检索研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:neoin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的飞速发展,网站数量激增,加上twitter,微信,微博等新媒体的广泛应用,信息资源已进入海量数据时代。在这些资源中,不仅包括易于处理的文本数据,还包括大量的图像、视频等多媒体数据。与文本相比,图像显得更为直观、生动,加上便携图像获取设备如智能手机的普及。数字图像的数量出现了飞速增长,几乎每年增加一倍。如何快速、准确地从海量网络资源中检索到感兴趣的Web图像成为迫切需要解决的问题。Web图像具有信息量高、数量巨大、非结构化、高层语义多样和不确定性的特点。使得信息检索领域的相关成果很难直接应用到Web图像检索领域。如何综合运用数字图像处理、模式识别、机器学习、信息检索等理论和技术,研究出性能高效的Web图像检索系统,为用户提供稳定可靠,准确度高的图像检索服务,具有重要的理论意义和现实价值。Web图像嵌入在网页中,不仅包含丰富的视觉信息,其所在网页的文本中也包含了大量与Web图像相关的信息。关于Web图像检索的研究主要基于这两类信息展开,包括三个方向:基于Web文本信息的检索模型TBIR、基于Web图像内容的检索模型CBIR和融合文本与图像信息的检索模型ABIR。TBIR从Web图像所在网页的文本中提取与Web图像相关的关键词用于Web图像的索引和检索。CBIR从Web图像的底层视觉信息中提取视觉特征用于Web图像的索引和检索。ABIR综合利用文本和图像信息用于Web图像的索引和检索。显然,同时使用文本和图像信息的ABIR具有更大的优势,但是这两种信息的结构不同(一个属于高层语义关键词信息,一个属于图像底层视觉特征信息),很难直接融合,怎样无缝地融合两者的信息依旧是Web图像检索领域的研究难点。直接使用图像视觉特征检索图像,需要用户提供样图或草图,给用户的图像检索造成极大的不便。而要将图像视觉特征转换为高层语义关键词,又存在“语义鸿沟”问题。因此,怎样将图像视觉特征映射为高层语义关键词是另一个要解决的难题。这两个难点导致ABIR的研究进展缓慢,还需要进行深入的研究。针对ABIR存在的问题,本文提出了一种基于网页信息和图像特征的Web图像检索模型,该模型将Web图像检索的信息源从两个(文本信息和图像特征)扩展到三个(文本信息、图像特征和图像中包含的文字),增加了Web图像索引的信息源。同时,通过图像自动标注解决“语义鸿沟”问题,将图像视觉特征映射为高层语义关键词。最后,利用贝叶斯推理网将三种信息源的关键词无缝地融合在一起,解决了异构信息的融合难题。词汇相似度计算是解决“语义鸿沟”问题的基础,也是本文提出图像检索模型中融合三种信息源的前提。因此,本文第四章详细介绍了基于知网的词汇相似度计算方法。图像中的文本分为场景文本和人工文本,这两种文本都与图像的内容和高层语义有很大的相关性。因此,将图像中包含的文本作为图像检索的信息源之一具有重要的意义。本文提出了基于笔画宽度检测的Web图像文本识别算法,将图像中的文字识别出来,增加了Web图像检索的信息源。图像自动标注是解决“语义鸿沟”问题的有效手段。本文提出的图像自动标注模型,通过三种经典的自动标注算法生成候选关键词集,然后通过词汇相似性计算候选关键词之间的内聚性和候选关键词与图像文本、Web文本关键词之间的一致性,将内聚性和一致性低于阈值的关键词作为“噪音”关键词从候选关键词中过滤掉。同时,将内聚性和一致性作为关键词的权重,为使用贝叶斯网络进行信息融合奠定基础。贝叶斯推理网络具有融合多种信息的能力,是一种基于概率的、不确定性推理网络。使用贝叶斯推理网的关键是如何确定各事件的初始概率和条件概率,本文引入了Page Rank(网页排名)确定初始概率,通过TF/IDF计算条件概率,构建了完备的贝叶斯网络图像检索网络。实验证明,本文提出的Web图像检索方法具有较高的图像检索质量。
其他文献
针对目前水平井分段注水技术中存在着下管柱遇阻风险大、注水合格率低、施工周期长等问题,研制了水平井无缆地面可调分层智能配水管柱。该工艺管柱采用压力脉冲配水技术,实现
随着社会经济的快速发展,中国的城市化进程逐步跨入快车道。为了实现对城镇发展的有效监督和管理,势必需要从海量的各类城镇数据中提取出能够为决策机构提供参考价值和智力支
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
目的探讨中间入路腹腔镜辅助下进展期胃癌根治术的临床应用与疗效。方法分析临床中间入路腹腔镜辅助下进展期胃癌根治术的62例患者,包括根治性全胃切除术11例,近端胃大部切除
目的研究益母草注射液与缩宫素及二者联合使用对剖宫产和经阴道分娩产后出血的治疗效果。方法研究对象为因医学因素或社会因素需行剖宫产者60例,经阴道分娩者54例,将其用盲法
在当今世界区域经济集团化迅猛发展的进程中,东北亚区域经济合作正以其巨大的发展潜力和诱人的美好前景成为世人瞩目的焦点。辽宁作为该区域内的经济大省,能否抓住机遇,在对外经济合作中实现振兴和发展,关键取决于我们能否做出正确的区域发展政策。  一、进行体制创新和机制创新  创新是一个民族进步的灵魂,是一个国家兴旺发达的不竭动力,也是各项事业不断取得发展的源泉。与长江三角洲和珠江三角洲相比,辽宁的落后表面上
目的通过运用经皮穴位电刺激(TEAS)技术辅助老年全髋置换手术后静脉自控镇痛(PCIA),探讨更为安全有效的多模式镇痛方法。方法腰部麻醉下全髋置换术且术后进行PCIA的患者60例,随机
目的:报告在直肠癌全系膜切除术(totalmesorectai excisionTME)基础上采用内括约肌切除(intersphincter resection ISR)治疗超低位直肠癌的手术经验和初步结果。 方法:病人
人工智能未来发展对于人类可能产生的威胁,目前越来越多的科学家和企业家表达了担心和忧虑,由此产生的人工智能威胁论引发了社会巨大争议。这争议背后本质上是人工智能系统能
坚持“以本为本”,培育新时代人才,本科教育是各高校最重要的任务,立德树人的成效已作为检验高校一切工作的根本标准,如何在专业课教学体现课程思政,已成为各高校专业课教学