论文部分内容阅读
微视频的迅猛增长为对微视频的有效管理及利用带来新的挑战,本文对微视频的场所识别进行研究。场所信息可带来一些潜在的多媒体应用如:地标/场所检索、地理位置摘要生成、城市计算和基于地理位置服务。但是由于微视频的音频部分表达能力不强,这大大地影响到微视频场所信息的表达。为此,本文提出了一个基于多模态字典学习算法。该算法能借助外部音频信息来增强微视频音频部分的表达。大量的实验证明了该算法的有效性。