基于无监督特征学习的多媒体内容理解算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:a570121851
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机视觉作为人工智能领域的重要组成部分,近年来已经受到越来越多的关注。同时,随着互联网的发展,多媒体数据在人们的日常生活中已经必不可少,并且数据量也呈爆炸式增长,在多媒体内容理解方面完全依靠人工力量已经逐渐力不从心。基于这两个原因,如何使用计算机对多媒体数据的内容进行自动的理解已经成为近些年来的研究热点。为了能够更好的理解多媒体的内容,提取一个好的特征尤为重要,本文对于如何从多媒体数据中提取高质量的特征进行了研究。有别于传统的特征提取方法,本文研究的是无监督的特征学习算法,即使用一种学习方法能够自动的从多媒体数据中发现并提取特征。本文着重探讨了两类无监督特征学习算法:稀疏编码和特征学习,并对图像和视频的特征提取都进行了研究,一共提出三种无监督的特征提取算法。第一,使用稀疏编码算法从已经提取的图像特征点中进一步发现具有普适性的结构化信息。同时,改进了现有词袋算法的两个重要步骤,将图像的特征表示得更加精确。第二,使用深度学习算法对图像进行无监督的特征学习。我们改进了现有的神经网络结构,加入了马尔科夫转移概率模型,并将其应用于图像特征的提取。第三,使用深度学习算法对视频进行多模态特征提取,并应用于暴力视频的检测。这里,我们使用了深度学习算法对于视频中的运动、图像以及音频特征进行了融合和特征提取,更加准确地对暴力视频进行建模。
其他文献
语音识别技术近年来高速发展,有着广阔的应用前景。让机器听懂人说话,甚至实现与人的交流是人类一直以来梦寐以求的愿望。现在语音识别技术的研究工作主要集中在大词汇量连续语
期刊
第三代(3G)移动通信系统具有较高的数据传输能力,可以提供广域覆盖和全球性漫游,理论上,它能为用户提供最高达 2Mbit/s 的数据速率,但部署成本非常高。作为一种有广阔前景的技术,
光路由器是全光网络的关键节点,主要负责完成光节点处任意光纤端口之间的光信号交换和选路。近年来全光网络的发展也使得光路由器技术成为研究的热点,本论文就是以重庆市教委项
目的:对后踝及外踝骨折采取后外侧入路手术治疗的效果进行探析.方法:回顾分析2016年10月 ~2017年2月我院骨外科收治的28例后踝及外踝骨折患者的临床资料,均采取后外侧入路术式
随着网络技术、通信技术和视频技术的发展,视频监控逐渐步入了全数字化网络阶段,而嵌入式网络视频监控系统正是其中的一个发展方向。目前,基于SOPC技术作为一门新兴技术在嵌入式
近年来,随着电信运营体制的变革和市场的开放,电信运营专业化分工日益成熟,业务经营模式不断翻新,各种增值业务层出不穷,本文通过对现今电信增值业务的分析,开发了一种在IP基础上进
随着无线通信技术日新月异的发展,无线通信业务的需求也在高速增长。多入多出(MIMO)技术是3G及未来移动通信系统中的关键技术,它利用收发端天线阵列能够有效地提高信道容量和极
期刊
目的 探究静脉药物配置中心药剂人员的职业防护的应用价值.方法 以2016年1月~12月作为本次研究的实验阶段,并选取74例在我院静脉药物配置中心工作的药剂人员,将其分为数量相等