基于隐马尔可夫链的音频语义检索

来源 :模式识别与人工智能 | 被引量 : 0次 | 上传用户:liongliong541
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为多媒体媒质之一的音频信号蕴涵了丰富的视觉听觉语义,但是目前多媒体检索主要利用的是视觉信息,音频信息被忽略。为了弥补这一不足,本文介绍了一个音频语义检索原型系统,在这个系统中,音频信号被分层次处理:首先分析音频信息中的短时能量、过零率和基本频率能量比等特征,音频信息流被接层次粗分为静音、和谐音乐、对话和环境背景音四类;由于环境背景音蕴涵了大量语义,环境背景音被继续细分,井用训练好的隐马尔可夫链表示每类环境背景音以进行语义检索。实验数据表明,这样的音频查询处理方式取得了良好效果。 As one of multimedia media, audio signal contains a lot of visual auditory semantics. However, multimedia retrieval mainly uses visual information and audio information is neglected. In order to make up for this problem, this paper introduces a prototype system of audio semantic retrieval. In this system, the audio signals are processed hierarchically. Firstly, the characteristics of short-time energy, zero-crossing rate and basic frequency energy ratio in audio information are analyzed, The level of information flow is roughly divided into four categories: mute, harmonious music, dialogue and environmental background sound. Since the ambient background sound contains a large amount of semantics, the ambient background sound is subdivided and expressed by a well-trained hidden Markov chain Ambient background sounds for semantic search. Experimental data show that such audio query processing has achieved good results.
其他文献
目的研究丹参对梗阻性肾间质纤维化(RIF)大鼠肾脏组织病理学的影响。方法建立大鼠RIF模型,取出正常组、假手术组、模型组、丹参治疗组的大鼠肾组织,分别做常规HE、PAS和MASSO
目的总结BCR-ABL融合基因阳性的急性淋巴细胞白血病(acute lymphoblastic leukemia,ALL)患者的临床特点、疗效和预后。方法回顾分析29例确诊为BCR-ABL基因阳性的ALL患者,予传
图像匹配是模式识别领域的一个重要方面,它在运动图像的识别中具有重要地位。本文主要针对人体腿部运动图像,提出了一种识别腿部关节的方法。它是分析腿部运动形态的基础。结果表明,该方法能给出准确的匹配结果。
矩不变量自从提出以来,在模式识别等方面得到了广泛的应用。由于受矩本身计算量的限制,很难实现实时计算,在高维空间中这一问题显得尤为突出。本文提出了一种建立在图像投影基础上的三维矩快速算法。该方法利用投影变换把三维空间的信息投影到一维空间,大大减少了运算量。利用该方法可以把三维矩计算的乘法运算复杂度从O(r~nN~n)降低到O(r~N),同时,加法运算复杂度也有很大程度的降低,并且,在运算过程中,不带
该文从挂篮荷载计算、施工流程、支座及临时固结施工、挂篮安装及试验、合拢段施工、模板制作安装、钢筋安装、混凝土的浇筑及养生、测量监控等方面人手,介绍了S226海滨大桥
期刊
目的 掌握东莞市广州管圆线虫病疫源地分布情况,为制定东莞市广州管圆线虫病防治策略提供参考.方法 采用随机整群抽样方法,抽取东莞市两个镇街作为调查点,通过匀浆法确定各调
目的通过两种方法检出率的比较,评价革兰染色法在阴道分泌物检验中的应用价值。方法对4 656例妇科门诊病人的阴道分泌物同时用革兰染色法和湿片法进行检验,按临床基础检验学
本文实现了一种对椭圆和矩形印章图像进行倾斜校正的方法,该方法基于对称Hough变换,以检测具有一对或两对对称轴的图形。和通常Hough变换相比,对称Hough变换具有较高的时间和空间效率,计算速度很快,检测椭圆和矩形的参数准确可靠。实验表明由该方法检测出来的印章图形的几何参数用于印章的倾斜校正,校正效果很好。
数据库中的知识发现是人工智能领域的一个重要课题.本文针对时序数据中复杂模式的问题,提出了一种新的时序序列模式的逻辑表示法,并设计出一种新的时序序列建模算法.
骨架是形态学中一个非常重要的概念,在形态分析、二值图像压缩等应用中有着广泛的用途。最近骨架的子集—终极腐蚀开始得到研究和应用。本文对骨架和终极腐蚀的一些性质进行了探讨,推广了非骨架点判定的判据,提出了非终极腐蚀点的概念及判定方法,并给出了这些判断的实现方法。