基于压缩域特征话者识别的电视节目分类检索

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:intaaae
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出在压缩域上直接对MPEG音频信号进行分析,达到电视节目实时分析检索目的.算法分为三步:首先利用压缩域特征对音频信号进行分割,然后应用分层方法把分割出来的音频片段粗分成音乐、语音和其它三个基本类别;由于话者身份是语音信号中的重要检索线索,最后利用隐马尔可夫链实现了与文本无关的话者识别,并用识别出来的话者身份对语音信号和其相应的视频进行标注. In this paper, the MPEG audio signal is analyzed directly on the compressed domain to achieve the purpose of real-time analysis and retrieval of television programs.The algorithm is divided into three steps: Firstly, the compressed domain feature is used to segment the audio signal, and then the layered method is used to divide the segmented audio segment Roughly divided into music, speech and other three basic categories; because the speaker identity is an important retrieval clue in the speech signal, the last uses the hidden Markov chain to realize the non-text-independent speaker recognition, and uses the identified speaker identity to the speech signal And its corresponding video tagging.
其他文献
党员领导干部的家风直接影响党风和社会风气,是党员廉洁从政的基础。本次论述分析了家风建设对党员干部的意义,探究了党员干部家风问题存在的原因,并有针对性地提出了解决措施。
未成年人犯罪问题是当今世界共性问题,在我国,未成年人犯罪通常是指已年满14周岁但不满18周岁的未成年人实施的违反刑法和有关刑事法律规定的犯罪行为。21世纪以来,我国未成年人
期刊
2017年7月4日,从河南省住房城乡建设厅传来消息,截至6月30日,河南省住房城乡建设厅和全省37家住房公积金管理机构全面接入全国住房公积金异地转移接续平台,实现“账随人走、
期刊
在新媒体时代下,党领导干部应顺应时代发展的形式,积极接受新的事物,把握住新的时机,将新媒体的传播作用切实的发挥出来,为中国梦的实现奠定扎实的群众基础。本文首先阐述了新媒体
本文介绍了恐惧管理理论的主要观点和基本假设;综述了死亡恐惧的防御机制,简述了恐惧管理之中的死亡凸显的实验研究范式并分析了恐惧管理理论实证研究的现状。
在古代雅典社会,公民妇女的社会地位非常低下,始终处于男性统治之下。本文试图从婚姻制度角度着手对古代雅典公民妇女地位加以认识。
本文将滚动优化思想应用于未知环境中无通讯的智能多机器人系统路径协调规划问题,提出了基于滚动窗口的多机器人协调方法,它能够快速有效地实现冲突检测与避碰,并可应用于复
美国的超验主义思想兴起于19世纪30年代,其延续至19世纪60年代。至今它已然过去了将近两个世纪,然而作为美国历史上的一颗明珠,超验主义并没有随着时间的流逝而失去光辉,它的影响
本文提出了基于子图像特征组合的商标图像检索算法.首先对商标图像进行子图像抽取,然后根据子图像单特征计算图像与目标图像的单特征距离,最后基于多特征组合得到图像相似性
规范公务员权利义务是公务员制度的核心。本文旨在通过对《中华人民共和国公务员法》第12条中有关公务员义务勤勉义务及其相应的保障权利进行中外比较分析,解读当前我国公务员