图像视觉特征及其描述词汇的对齐研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:wtxsing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,越来越多的应用需要将视觉数据翻译为自然语言。研究视觉信息与描述语言之间的关联成为一个重要的课题。VIMAC系统是北京邮电大学智能科学与技术中心研制的一个基于视觉信息的汉语词汇习得系统,该系统基于图像-语言描述对集合,为语言词汇建立基于视觉信息的表征,并能应用于图像描述的自动生成。本论文的研究基于VIMAC系统的工作,一方面在VIMAC系统研究成果的基础上展开,得到更细颗粒度的语言-视觉信息对,其中着重解决了在训练语料中未出现的未登录词的图像特征表示;另一方面又为VIMAC系统的改进提供了新的支持,可用于在图像的外部说明文本中发现和定位对应的视觉对象描述词汇,从而达到辅助进行图像检索的目的。基于VIMAC习得系统,我们可以获得词汇类别与视觉特征的对应关系,所以图像视觉特征及其描述词汇的对齐关键就在于为句子中的词汇确定其所属的范畴,也就是词分类问题。我们通过对图像描述句进行包括切分,词性标注在内的预处理后,基于知网提取图像描述语料中的关于颜色、大小、位置、形状的词汇,进行分类,最终将词汇与其相对应的图像的视觉属性对齐。本文同时对实现这一过程中的几个关键因素对最终性能的影响进行了分析。实验表明,对语料进行词性标注处理后,词语分类正确率大大提高;当训练语料逐步增加时,分类性能也逐步增加,但当语料达到一定规模后,性能基本也趋于饱和。之后,我们建立了一个数据库,将图像信息及其标注存储起来,便于之后的添加,提取,修改和管理。最后为了直观的显示,利用ASP技术,编制出动态网页,实现了特定图像信息的搜索。
其他文献
报警是及时发现生产过程中异常状况的重要手段。然而在实际生产中报警信息中存在大量的错报警和滋扰报警,严重影响了操作人员处理异常工况的效率。通过评估报警系统各种性能
对称锥上的优化问题是一类较广的优化问题,以Rn中的非负锥(Rn+)、二阶锥(Ln+)以及半正定对称矩阵锥(Sn+)上优化问题为其特例.近年来,对称锥上的优化问题日益成为国内外相关学
印刷电路板在电子通讯设备、电子计算机、家用电器等方面广泛应用。近几十年来,电子信息技术的快速发展,电子元件的尺寸逐渐缩小,电子元件排布越来越密集,使其散热面积减小,
我国温室大棚农业起步晚,发展快。温室大棚农业节省资源、节约肥料、能克服季节及天气的影响,可有效地改善种植品质问题。针对当前我国温室大棚农业依然大量存在依靠人工经验种
一、鲁棉研15号该品种是山东棉花研究中心新育成的抗虫杂交棉新品种,是目前国内同类品种中表现最好的品种。于2001年4月通过山东省农作物品种审定委员会审定。鲁棉研15号中
随着微电子技术、计算机技术以及通信技术的飞速发展,工业网技术也日见成熟,正在向着集成化、智能化方向发展。罗克韦尔自动化有开放的Netlinx网络架构及ControlLogix平台在
本论文是以国家科研项目“直线驱动控制系统研究”为依托,把永磁同步直线电机作为研究对象,采用模糊控制、滑模变结构控制方法分别设计直线驱动控制系统速度控制器,并与传统PID速度控制器进行比较分析。同时,针对直线驱动中特有的一些问题,如摩擦力扰动、电机推力波动及系统模型参数摄动等不良因素,对两种控制器进行优化设计,削弱、抑制扰动因素的不良影响,实现对系统给定速度信号的快速、准确响应,提高系统的鲁棒性,从
磁悬浮技术是集电磁学、机械学、控制工程和计算机等科学于一体的技术。由于其具有无摩擦、无磨损、寿命长、低功耗、无噪声等优点,因此成为各国科学界研究的热点。但是由于
1965年我所矮脚南特栽培面积45.73亩,占早稻总面积的94%,平均亩产906.8斤。其中塑料薄膜育秧的本田面积12.2亩,平均亩产1,001.2斤,产量最高的2.15亩,单产达1,077.6斤。现在初
农牧渔业部顾问刘锡庚同志在全国杂交 水稻生产会议开幕式上的讲话…1-1杂交水稻超高产制种的设想。……1—3粮食生产形势与“七五”期间杂交水 稻的科研任务………………2—