基于隐马尔可夫分类模型的音频检索技术研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:wuzhaoan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来随着多媒体数据成指数级的增长,多媒体分类和检索变得越来越迫切。当人们在浏览和理解视/音频内容时,作为多媒体数据中标志性部分的音频,为人们的感知提供了重要线索。   本文对音频检索技术中的相关问题进行了探讨,着重研究了音频分类和音频检索技术。   本文的主要工作和研究成果包括以下几个方面:   首先,研究了基于隐马尔可夫模型(HMM)音频分类的基本原理和算法思想,提出了一种将单状态HMM用于音频分类的方法。在单状态HMM音频分类识别过程中把一段音频整体看作一个状态,所有的音频帧都属于同一状态,在模型训练过程中不存在状态转移概率矩阵,克服了多状态HMM在模型训练过程参数设置不准确的缺陷。取得了较好的音频分类效果   其次,在音频分类的基础上研究了基于隐马尔可夫分类模型的音频例子检索方法,其具体过程为:将某类音频用一个模板表示出来,对于用户提交查询的音频例子,先使用模板去进行匹配,判断其属于哪类模板,然后将这类模板对应的音频例子按序反馈给用户。接着针对音频分类检索系统的实际问题,讨论了基于web连接的设计思想和系统设计的软件环境。   最后,基于Matlab Web Server初步设计了一个音频信息分类与检索的系统。尽管国内外研究者就音频检索技术开展了大量的研究工作,但音频检索技术仍处于研究初级阶段,实用的音频检索系统不多,这是音频检索技术应用领域面临的困境。本文设计的音频信息检索系统不仅可作为独立的系统,而且可以嵌入到其它多媒体系统中去,以提供满足基于内容的音频分类与检索服务。
其他文献
随着软件系统的普及,软件测试成为保证软件质量、提高软件可靠性的重要手段。而软件测试的工作量很大,用人工测试几乎难以胜任,在规模迅速扩大的软件系统中,实现高准确度,高
多媒体的应用越来越广泛,已经成为网络传输的主体,如何有效传输这些多媒体数据,已经成为网络时代的一个新的研究方向。多媒体传输涉及到一系列多媒体相关理论,如多媒体数据压
随着信息技术的发展,数据挖掘技术得到了广泛的关注。在数据挖掘技术中有很多研究领域,聚类分析是数据挖掘的一个非常活跃的研究方向,有着重要的理论意义和应用价值。目前在
学位
随着信息爆炸式的增长,相似性检索被越来越多地应用于非结构化数据库中,例如图像库、三维对象库、生物序列库等。相似性检索已经成为信息检索中的一个重要研究领域。然而,在
随着互联网的发展,理解网络行为对于网络管理、规划和发展都有重要意义,网络流量测量是研究网络行为的基础,也是分析网络状况、掌握网络流量特征的有效方法,因此网络流量测量变得
学位
信息化社会的发展对人的身份的有效鉴定提出了更高的要求,这使掌纹识别技术的研究走向深度。其中,基于方向特征的掌纹识别方法表现最为突出,取得了很好的识别效果。该方法一
市场竞争的加剧,对工作流产品的时效性、柔性和可靠性提出了更高的要求。而动态多变的业务环境,加上业务流程常具有一定的时间约束,工作流系统的运行过程中时间异常的出现频率大
当前E-Science等网格应用日益普及,致使以IP over Optical为核心的光网格计算环境相关技术得到了广泛关注,目前国际上许多研究组织或机构,重点资助了一批专项研究项目(如:DRA
学位
随着嵌入式应用的日益普及,业界对嵌入式操作系统用户界面美观性等诸多方面提出了更高的要求,而桌面环境为操作系统提供一个更加完善的界面以及大量各类整合工具和应用程序,由于
移动Ad Hoc网络(Mobile Ad Hoc Network,MANET)是由一组带有无线通信收发装置的移动终端节点组成的一个多跳、临时和无中心的网络。路由协议一直是MANET研究比较活跃的领域,
学位