基于隐马尔可夫链的音频语义检索

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户：liongliong541

【摘要】

：

作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,

【作者】

：

吴飞庄越挺张引潘云鹤

【机构】

：

浙江大学,

【出处】

：

模式识别与人工智能

【发表日期】

：

2001年01期

【关键词】

：

分层分割隐马尔可夫链音频检索

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被接层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,井用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索。实验数据表明,这样的音频查询处理方式取得了良好效果。 As one of multimedia media, audio signal contains a lot of visual auditory semantics. However, multimedia retrieval mainly uses visual information and audio information is neglected. In order to make up for this problem, this paper introduces a prototype system of audio semantic retrieval. In this system, the audio signals are processed hierarchically. Firstly, the characteristics of short-time energy, zero-crossing rate and basic frequency energy ratio in audio information are analyzed, The level of information flow is roughly divided into four categories: mute, harmonious music, dialogue and environmental background sound. Since the ambient background sound contains a large amount of semantics, the ambient background sound is subdivided and expressed by a well-trained hidden Markov chain Ambient background sounds for semantic search. Experimental data show that such audio query processing has achieved good results.

其他文献

丹参对梗阻性肾间质纤维化大鼠肾脏组织病理学的影响

目的研究丹参对梗阻性肾间质纤维化(RIF)大鼠肾脏组织病理学的影响。方法建立大鼠RIF模型,取出正常组、假手术组、模型组、丹参治疗组的大鼠肾组织,分别做常规HE、PAS和MASSO

期刊

丹参梗阻肾间质纤维化病理学

BCR-ABL基因阳性成人急性淋巴细胞白血病29例临床分析

目的总结BCR-ABL融合基因阳性的急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)患者的临床特点、疗效和预后。方法回顾分析29例确诊为BCR-ABL基因阳性的ALL患者,予传

期刊

急性淋巴细胞白血病成人BCR/ABL融合基因疗效预后

人体腿部运动图像的跟踪

图像匹配是模式识别领域的一个重要方面,它在运动图像的识别中具有重要地位。本文主要针对人体腿部运动图像,提出了一种识别腿部关节的方法。它是分析腿部运动形态的基础。结果表明,该方法能给出准确的匹配结果。

期刊

图像匹配关节跟踪

一种新的基于投影的三维矩快速算法

矩不变量自从提出以来,在模式识别等方面得到了广泛的应用。由于受矩本身计算量的限制,很难实现实时计算,在高维空间中这一问题显得尤为突出。本文提出了一种建立在图像投影基础上的三维矩快速算法。该方法利用投影变换把三维空间的信息投影到一维空间,大大减少了运算量。利用该方法可以把三维矩计算的乘法运算复杂度从O(r~nN~n)降低到O(r~N),同时,加法运算复杂度也有很大程度的降低,并且,在运算过程中,不带

期刊

模式识别图像处理三维矩

警惕猪土豆中毒

该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥

期刊

东莞市广州管圆线虫病疫源地调查

目的掌握东莞市广州管圆线虫病疫源地分布情况,为制定东莞市广州管圆线虫病防治策略提供参考.方法采用随机整群抽样方法,抽取东莞市两个镇街作为调查点,通过匀浆法确定各调

期刊

广州管圆线虫疫源地宿主东莞

革兰染色法与湿片法诊断细菌性阴道炎结果比较

目的通过两种方法检出率的比较,评价革兰染色法在阴道分泌物检验中的应用价值。方法对4 656例妇科门诊病人的阴道分泌物同时用革兰染色法和湿片法进行检验,按临床基础检验学

期刊

阴道分泌物革兰染色法湿片法

基于对称Hough变换的印章倾斜校正方法

本文实现了一种对椭圆和矩形印章图像进行倾斜校正的方法,该方法基于对称Hough变换,以检测具有一对或两对对称轴的图形。和通常Hough变换相比,对称Hough变换具有较高的时间和空间效率,计算速度很快,检测椭圆和矩形的参数准确可靠。实验表明由该方法检测出来的印章图形的几何参数用于印章的倾斜校正,校正效果很好。

期刊

对称Hough变换印章校正图像处理

基于时序数据的模式发现算法研究

数据库中的知识发现是人工智能领域的一个重要课题.本文针对时序数据中复杂模式的问题,提出了一种新的时序序列模式的逻辑表示法,并设计出一种新的时序序列建模算法.

期刊

知识发现时序数据时序模式

图像骨架和终极腐蚀的若干性质

骨架是形态学中一个非常重要的概念,在形态分析、二值图像压缩等应用中有着广泛的用途。最近骨架的子集—终极腐蚀开始得到研究和应用。本文对骨架和终极腐蚀的一些性质进行了探讨,推广了非骨架点判定的判据,提出了非终极腐蚀点的概念及判定方法,并给出了这些判断的实现方法。

期刊

形态变换骨架终极腐蚀非骨架点非终极腐蚀点

基于隐马尔可夫链的音频语义检索

与本文相关的学术论文