农业视频语义描述算法的研究与实现

来源 :西北农林科技大学 | 被引量 : 0次 | 上传用户:huang267321
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了解决农业视频的语义索引不完善的问题,研究并实现农业视频语义描述算法,为农业视频生成描述其语义的自然语句作为农业视频的语义索引和内容梗概,从而实现基于语义关键字的农业视频检索和对检索结果的人工筛选,大大降低农业从业者检索具体农业生产活动相关视频的时间,有助于推动农业信息化的发展。农业视频语义描述面临着诸多困难,如怎样提取代表农业视频语义的语义关键帧、怎样识别语义关键帧中的物体及相对关系、怎样用自然语句表达语义关键帧的识别结果等,是一项涉及到计算机视觉和自然语言处理的跨学科难题。本文对农业视频语义描述的解决思路是:将农业视频按照画面过渡分割为镜头并为每个镜头提取语义关键帧,为语义关键帧提取图像特征并映射到含义空间,为人工对语义关键帧添加的语义描述提取文本特征并映射到含义空间,在含义空间使用递归神经网络学习语义关键帧生成语义描述,从而为任意语义关键帧生成语义描述。本文的主要工作如下:(1)语义关键帧的图像特征提取。为农业视频提取压缩关键帧,在压缩域基于直方图特征使用固定阈值的镜头边界检测算法将农业视频分割为镜头,使用K-Means聚类算法为镜头提取出语义关键帧;基于人工为语义关键帧添加的物体位置信息训练深度图像特征提取器,为语义关键帧提取深度图像特征。(2)语义描述的文本特征提取。为农业视频的语义关键帧人工添加语义描述,使用分词算法对语义描述进行分词操作并统计分词结果中的所有词汇构建初始中文词表;使用中文词汇相似度判定算法对初始中文词表中的同义词进行合并得到最终中文词表,将语义描述中的词汇序列相对于最终中文词表的索引序列作为语义描述的文本特征。(3)语义关键帧生成语义描述的学习。将语义关键帧的图像特征映射成含义空间的一个含义向量并编码入递归神经网络的隐藏层;将语义关键帧对应语义描述的文本特征映射成含义空间的一组含义向量作为递归神经网络隐藏层的解码输入,根据训练数据集中的语义关键帧和语义描述学习递归神经网络的编码矩阵和解码矩阵。本文的主要创新在于基于区域而不是基于整幅图像为语义关键帧提取图像特征、基于同义词而不是基于词汇为语义描述提取文本特征,在农事直通车数据集上的实验表明,这两种创新分别将农业视频语义描述的得分提高了5.1和1.7。
其他文献
主观量是客观世界的量范畴在语言中的一种表现,是一种含有说话人主观评价的量。本文采用前人对语言主观性的研究成果,根据说话人的主观感受、态度和评价,对客观的量进行不同
在修井作业中,连续油管修井工艺具备显著的技术优势,安全性、稳定性、灵活性、工具配套性、作业效率都大大提升,并且相对常规修井工艺,连续油管修井工艺在保护油层,增加产量
本文以翻译文本阿不都肉苏力·斯依提先生著的《书信里的故事》一书中出现的量词为研究对象,对书中出现的量词进行穷尽式搜集统计,结合书中实例分析,将维语量词进行分类整理
服饰是人类物质和精神文明的象征。维吾尔族服饰展现了维吾尔族独具一格的审美风格。在服饰文化的差异下,将维吾尔语中的服饰词翻译成汉语是十分重要的。本文通过对《命运之
熟语作为一个民族语言的精华,出现在文学作品中,以凝练生动的语言,整体的结构和完整的语义,在文学作品中起到点睛之笔的作用。本文通过搜集维文小说《书信里的故事》中的熟语
现如今,我国经济发展正处在稳定发展的阶段,经济体系也逐渐完善,为了在各方面的竞争中立稳脚跟,有关油田企业也在开发过程中,在井下也容易出现一系列问题,极易引发注采比失衡
目的 观察右美托咪定在小儿脑室-腹腔分流术中对血流动力学、术毕苏醒期躁动的影响以及脑保护作用。方法74例行脑室-腹腔分流术的先天性脑积水患儿,通过随机数表法分为观察组
随着社会日益信息化以及网络产品日益普及,自然语言理解已经成为计算机科学中一个最引人入胜的、最富挑战性的课题。本文将自然语言理解中的方式信息的理解应用于产品设计,通过
自古以来,新疆居住的汉民族和维吾尔族就有着密切交流,并且汉民族丰富的饮食文化也日益成为结合两个民族间的交流纽带。笔者收集了《秦腔》中出现的各类饮食名称词,并对这些
普通话口语训练是秘书学专业的一门必修课,其教学目标是以理论为指导,以训练为主导,培养学生使用标准普通话进行朗读、对话、演讲及其他口语交际活动的能力,从而提升学生的职