基于网页关联特征的互联网图像自动标注系统

被引量 : 0次 | 上传用户:helloclare
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的速度增长。设计一个能够快速准确地检索用户需要的图像的方法有着巨大的现实意义。目前主要有两种图像检索方式。一种是基于图像关键字的检索(TBIR),另一种是基于内容的图像检索(CBIR),它们之间的差别在于图像内容的标注方式不同。 基于关键字进行图像标注目前主要有两种方法:一个或多个人手工选择的关键字标注、图像关键字标注自动生成装置自动生成。第一种方法,有很大的缺点,费时费力,标注的准确性和完整性不够,且往往带有主观偏差。第二种方法主要应用于目前常见的互联网图像检索系统中,根据图像所处的上下文环境来判断图像的主题内容,这种标注方式符合人们的检索习惯,实现简单。但由于互联网的复杂性,使用这种标注方式的标注信息不够准确全面。 基于内容的图像检索,是直接从图像信息源中获得视觉内容特征,如颜色、纹理、形状作为图像内容的标注,图像检索的时候查找出和被检索图像视觉特征近似的一个或多个图像当作检索结果返回。这种方式需要进行大规模的计算,并且最终将这种低层的视觉特征映射到高层的语义后,由于图像的复杂性、标注字语义的不确定性,依然存在标注结果与用户理解之间的偏差。 为了克服以上方法的不足,提高互联网上检索图像的质量,本文提出一种新的图像标注方法,综合运用自然语言,文本分类及自适应的网页正文提取等技术,基于网页上图像的多种关联特征,包括:图像的URL,图像的上下文,图像所在的网页主题等,对图像进行关键字标注。 本文的重点设计并实现了一个基于网页关联特征的互联网图像自动标注的原型系统,主要内容包括:对网页中图像关联特征的提取和基于这些特征对图像的标注两部分。在对图像关联特征进行提取时,利用本文提出的两种算法:基于DOM树图像上下文提取算法和基于视觉与规则的正文提取算法,能够准确地抽取出网页中与图像相关的语义信息。在对图像进行标注部分,利用所提取的关联特征和文本分类技术,实现对图像的语义标注。
其他文献
<正>应日本实验动物学会的邀请,中国实验动物学会代表团一行八人在中国医学科学院实验动物研究所所长秦川教授的带领下参加了第60届日本实验动物学会年会,并参观了日本理化学
大都市的集聚效应一直是城市经济学和区域经济学研究的重要主题,自20世纪90年代以来,集聚效应的研究进入了新的阶段,这就是用规范的经济学工具和方法来研究经济活动的空间集聚,并
目的制备多种抗猪鼻支原体的单克隆抗体,建立双抗体夹心ELISA方法用于该病原体的检测。方法用猪鼻支原体CVCC361免疫BALB/c小鼠,采用杂交瘤技术和酶联免疫吸附实验筛选出抗该
根据中国的具体国情,构建科学合理、公平公正的社会收入分配体系,既是建立健全社会主义市场经济体制的一项重要内容,也是贯彻落实科学发展观、建设和谐社会的题中应有之义。在收
突发公共事件中的信息传播,很大一部分是政治信息的传播,因为在突发公共事件中,政府占有权威的信息源,媒体对事态的报道情况很大程度上取决于政府对外信息公布的状况。研究公
一般认为,是贝卡利亚首先将启蒙思想引入刑法领域,贝氏也因此被称之为"刑法学之父"。其实,早在贝氏之前(早于贝氏113年),霍布斯就完整地提出了罪刑法定和罪刑相适应的刑法基
WTO《农业协定》实施后,世贸组织农业贸易的框架逐步形成和完善,各国的农业政策开始受到多边贸易体制的约束,对农业的国内支持措施也承担削减的义务。为了遵守国际农业贸易领