视频图像语义信息提取研究

来源 :复旦大学 | 被引量 : 4次 | 上传用户:tommy8248
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对视频图像进行语义信息的提取,可以满足用户基于语义的检索需求。在现有的一些语义信息提取方法中,存在如下问题:(1)如何构建合理的语义概念层次;(2)如何有效地表征视频图像所涉及的语义概念;(3)如何自动发现语义概念间的关联性并加以利用;(4)如何动态地融合语义信息;(5)如何挖掘视频在时域上的依赖信息并加以利用。针对上述问题,本文提出了三种方法,从不同层面分别进行解决。首先,本文提出一个自底向上的层次化语义提取框架。这个框架将视频镜头的底层特征、语义概念中的物体和语义概念中的场景划分为由底向上的三个层次。这个层次结构简单,也具有较好的表征能力。视频镜头的底层特征是在对视频镜头关键帧分割后的区域上提取的。针对每一种底层特征和每一个物体概念,训练得到的支持向量机,用本文提出的boosting方法,在不同特征上进行融合,得到了针对显著物体的检测器。本文提出了两种利用这些检测器的置信度输出,对视频镜头进行语义表征的模型向量,并在这两种模型向量的基础上对场景概念进行学习。实验证明本文的语义概念层次的有效性、boosting融合对性能的提升以及所提出的模型向量的优势。接下来,对于半自动的图像标注,本文将它形式化为一个多标记学习问题,并提出了一个基于辅助标签的半自动图像标注方法。该方法将归一化互信息作为定量地衡量语义标签之间关联度的指标,并采用一种动态混合模型改善标签的分类结果。该方法具有一个框架性的结构,很容易与标签的相关反馈信息结合,加速人机交互过程。实验结果表明该方法可以改善不同学习算法的分类结果,而且能够更有效地利用相关反馈信息,具有比其他方法更快的人机交互速度。最后,本文挖掘视频镜头在时域和空域上的关联信息,寻找同一镜头和相邻镜头中有助于一个目标物体检测的辅助物体,并确定这些辅助物体能够提供最大辅助信息的位置,这些辅助信息在一个动态混合模型中被整合,提高了原来的视频镜头中的物体检测性能。
其他文献
随着高层建筑钢结构工程建设数量和规模的不断发展,如何在提高钢结构焊接生产质量和效率的同时降低焊接操作工人的劳动强度成为了一个需要解决的关键问题。通过选择合适的焊
文章以《内蒙古大黑河卓资山镇段区域水资源量评价》为例,对卓资山镇段区域水资源量进行了计算和评价,为本区经济的可持续发展、科学的利用水资源、加强用水管理和节约水资源提
通讯干扰是现代航空导航中必不可免的问题之一,为了降低通讯干扰对航空飞行的影响,就要及时对飞机进行干扰项的排查与监测。以保证飞机的航空质量,保障飞机飞行安全。本文针
本期嘉宾: 王玲(大千茶艺馆馆长) 潘雁群(河北承德乾隆醉酒厂驻石家庄办事处经理) 封广川(御场火锅城老板) 王海龙(海龙诊所医生) 张悦(《精品导报》记者) 时间:1999年3月12日 地点:大千茶艺馆
期刊
以白肉和红肉火龙果果皮为研究对象,探究大孔树脂对火龙果色素分离纯化工艺.采用静态吸附和解吸实验比较ADS-7、S-8、NKA-9、AB-8、D-101、X-5六种型号树脂分离纯化效果,实验
“茶艺”在石家庄的兴起,也就两三年的时间,然而它的发展速度之快,却令许多人吃惊不小,这不能不使人对那些“茶人”刮目相看…… 一.巧遇众“茶人” 世面上的各种“人”,在下见过的
期刊
教师引导学生在生活的情境中认识列、行的含义,并利用行列确定位置,进而抽象出用有序数对描述平面上点的位置。学生在逐次"数学化"的活动过程中,体验数形结合的思想,发展数学
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
教育扶贫是实现打赢脱贫攻坚战的重要方法,实施好教育扶贫政策对于提高农村贫困人口质量和增强贫困人口内生发展动力具有重要意义。党的十九大报告提出教育优先发展的战略,对于贫困地区而言,坚持教育优先发展尤为重要。近年来,由于国家对教育尤其是农村贫困地区教育投入力度不断加大,农村贫困地区的教育教学条件有了较大程度的改善,农村贫困人口通过相应的教育扶贫政策掌握了一定的知识和技能,为摆脱贫困积累了人力资本,增加