新闻视频语义概念探测与语义检索关键技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:soundbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻视频由于其真实准确、内容丰富、信息量大等特点,成为人们获得信息的重要媒体类型。对于情报人员而言,新闻视频是一种公开的情报源,其时效快,且反映各国政治、经济、军事和外交政策,从而能够为情报人员提供丰富情报,为战略决策分析提供重要辅助,因此研究新闻视频的语义分析技术无论对于普通民众或是情报分析人员都具有非常重要的意义。但是新闻视频的底层特征与高层语义之间存在的语义鸿沟问题使得新闻视频的语义内容分析面临巨大困难,并且新闻视频的非结构化的数据格式、巨大的数据量以及表现内容不透明等特点使得人们难以方便快速对新闻视频进行浏览和检索。由此可见,分析新闻视频的语义内容以辅助用户获得有效的新闻视频信息是值得深入研究的问题,本文针对此具有理论意义及应用前景的课题进行了探索和研究,目的在于解决新闻视频语义概念探测和语义检索中部分关键技术,为构建有效的新闻视频语义检索系统提供技术支持,同时也为获得新闻视频的视觉语义内容、跨越语义鸿沟提供解决思路。本文首先建立一个新闻视频语义检索研究的技术框架,在此基础上重点研究基于概念关系的语义概念探测、基于多线索信息的语义概念探测、新闻视频语义索引构建以及用户查询多模态语义扩展等关键性技术,通过实验验证了本文研究的可行性和本文所提出算法的性能。论文的主要贡献具体表现在如下几个方面:1、提出了基于概念关系的语义概念探测方法。对语义概念间存在的上下文关系进行定量定性分析,针对显式和隐式两类语义概念探测方法提出新的解决思路。针对隐式探测方法,提出在基于上下文关系的语义概念探测框架中增加相关概念选择模块,并结合视觉相似性、探测器准确率等多项要素得到最终的融合判定;在此基础上,根据概念关系对Boosting方法中的权重分布策略进行改进,在限制权重扩张的同时平衡了探测模型训练过程中的误判率与误拒率。针对显式探测方法,有效利用语义概念的共现与互斥关系,将精化过程转化为随机漫步过程,并分解为正、负相关两个部分进行迭代精化处理以保证随机过程的收敛,进一步去除不可靠相关概念,以获得更为鲁棒的精化结果。2、提出了基于多线索信息的语义概念探测方法。分析了对于探测新闻视频语义概念具有重要作用的多线索信息,包括运动信息、时间信息以及文本信息。针对运动信息,提出了运动特征与背景特征相融合的语义概念探测框架,采用运动局部不变特征描述子对镜头进行运动特征提取,并采用概率潜在语义分析获得镜头的潜在语义以构建潜在运动语义概念探测模型;针对时间信息,综合分析语义概念的多种时序关系,包括时间一致性关系、镜头间上下文关系以及镜头内上下文关系,构建了基于扩展N-gram语言模型的时序平滑框架,并利用高阶时序关系抑制模型中的数据稀疏问题。3、提出了新闻视频的层次化语义索引结构,包括潜在概念、语义概念、文本词汇以及高层的概念聚类。针对高层概念聚类,提出了基于四部图划分的新闻视频故事单元聚类方法。该方法在分析新闻视频高阶异构特性的基础上,构建了新闻故事单元的四部图模型,将四部图联合聚类问题分解为三个二部图划分问题,并进一步转化为多目标优化问题,采用半正定规划方法获得全局最优解,以得到最终的联合聚类结果。4、提出了用户查询的多模态语义扩展方法,利用WordNet衡量查询文本与语义概念间的相似度,并结合概念关系完成查询与语义概念的初步映射,在此基础上提出多特征交互框架,利用包括语义概念、潜在语义、文本语义在内的多类语义特征之间的互补特性,对初始检索结果进行重排序,以获得多模态语义扩展的用户查询,并与层次化语义索引进行映射得到最终的语义检索结果。5、基于本文的研究内容,设计和实现了一个新闻视频语义检索原型系统。分层次、分模块的对原型系统进行了设计思路、总体架构和运行流程方面的阐述。新闻视频语义检索原型系统以本文研究的关键技术作为技术内核,实现了语义概念标注、语义索引构建及语义检索等各项功能。
其他文献
本文针对目前高校思想品德教育工作评价系统的不足,采用HTML5+CSS3和Node.js技术,让学生跨平台提交信息,实现学生思想品德教育量化考核,有效提升高校思想品德教育质量及管理水平。本文首先介绍了设计思路、关键技术、系统模块结构、数据库设计,然后描述了系统的主要功能。
据悉,北京著名的卢沟桥景区西北约1公里处,曾屹立着一座1公里长、35米高、重达300万吨的钢渣山,强劲的西北风过后,抚摸卢沟桥的狮子,游客很可能摸来一手黑灰。
本文拟开发一种基于深度卷积网络的冠状动脉血管自动分割方法:先基于灰度信息的搜索提取出心脏外轮廓,并采用融合先验知识的三维全卷积网络完成对冠状动脉血管网络的预分割,再经过CRF处理完成冠状动脉血管网络完全分割。提出一种套无创式冠状动脉血管疾病的无创精准诊断提供新的方法和手段并将其应用于临床,提高冠脉血管分割方法的准确性,辅助临床医生准确诊疗冠心病,以延长患者生存时间和提高生存质量,并推动影像组学技术
本文通过对高基报表填报工作进行概述,并提出了当前所面临的一些问题,在此基础上,提出了大数据技术在高基报表工作中的一些应用。
介绍了水泥工业处理、利用城市生活垃圾、污泥、工业废弃物、高炉矿渣、可燃废弃物典型事例,特别推出了"乌兰模式"--一条龙产业链模式.
《会计电算化》课程改革对培养学生的专业应用能力具有积极作用。首先,要创新教学理念,改革教学模式,课程开发主体由单一化向多元化转变,课程?目标由专业知识学习向职业能力培养转
摘 要 目的:探讨锁骨骨折的治疗方法。方法:临床治疗80例,均采用重建钢板内固定,其中輔以粗丝线或细钢丝内捆扎固定16例,取自体髂骨植骨15例。结果:随访6~36个月,平均12.6个月,术后X线片检查显示骨折均为解剖复位,合并肩锁关节脱位者均已复位,内固定物无松动、变形、断裂,无术后再发骨折移位,无骨折延迟愈合、不愈合和畸形愈合。术后12~27天,肩关节活动基本正常。结论:重建钢板内固定锁骨骨折,
在初中信息技术教学过程中,学生由于教学模式、教学方法、教学内容等方面的原因在课堂教学过程中出现了学习不投入,参与度不高的现象,导致整体课堂教学不仅效率低,而且质量差
本文首先对改进Sobel算子进行描述,然后提出了基于Sobel算子图像预处理的目标检测算法.该算法使用Sobel算子对图像进行预处理,通过阈值设定,检测运动目标,针对目标位置、速度建立图像ROI区域,对连续目标建立帧间关联,并确立置信度,最终实现目标检测目的。对该算法进行试验测试,试验表明,该算法能较好的检测运动目标,具有较好的鲁棒性。
本文主要针对柔性自动化技术中传感器的应用情况进行分析,目的是将柔性自动化测试技术的优势得到更加全面的体现,进一步推动我国电气自动化行业的发展,促使我国工业领域不断变革。