多媒体传感器网络中音频语义分析方法的研究

来源 :北京邮电大学 | 被引量 : 2次 | 上传用户：OsWorkFlow

【摘要】

：

随着人们监控要求的日趋复杂多变,迫切需要将信息丰富的音频、视频、图像等多媒体信息引入到以传感器网络为基础的环境监测活动中来,实现细粒度、精准信息的环境监测,多媒体

【作者】

：

李祺

【出处】

：

北京邮电大学

【发表日期】

：

2010年01期

【关键词】

：

多媒体传感器网络音频特征音频元素音频高层语义

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着人们监控要求的日趋复杂多变,迫切需要将信息丰富的音频、视频、图像等多媒体信息引入到以传感器网络为基础的环境监测活动中来,实现细粒度、精准信息的环境监测,多媒体传感器网络因而成为近年来的研究热点。音频语义分析技术对自动感知环境特征、提高环境监测的精确度等具有重要意义。如何有效地提取监控场景中的音频语义信息是多媒体传感器网络的重要研究内容之一。针对多媒体传感器网络中的音频语义分析问题,本文从音频特征选择、基本音频元素检测和音频高层语义分析三个方面提出一系列新模型和新方法。本论文的主要贡献如下：(1)基于可鉴别主成分分析的音频特征集构造方法。音频特征的选择与提取是在多媒体传感器网络中进行音频语义分析的基础。一方面,所选取的特征需要充分体现出音频信息在时域和频域中的重要分类特性。另一方面,为了节省后序处理中的计算能耗,我们需要控制特征维数、降低特征间的冗余性。本文提出了一种基于可鉴别主成分分析的特征集构造方法。该方法将主成分分析方法和线性鉴别分析方法进行结合,既提取了音频信号的最佳表示特征又根据训练样本的类别信息提高了这些特征的鉴别能力。通过这种方法,我们可以提取音频信息中最为关键的并相互独立的特征。(2)基于加权关联图的基本音频元素检测方法。基本音频元素检测是音频底层特征与音频高层语义信息之间的桥梁。在本文中,我们提出了一种基于加权关联图的音频元素检测方法。该方法首先利用隐马尔科夫模型对多种基本音频元素建模,然后,根据先验知识在基本音频元素模型的基础上建立加权关联图模型。此外,考虑到对不同音频元素检测失误所造成的决策风险不同,我们采用基于最小风险贝叶斯决策的方法进行音频元素判定。通过这种方法,我们能够在音频背景复杂、多种音频事件同时发生的多媒体传感器网络中,准确地提取音频低层语义信息。(3)基于神经网络的音频高层语义分析方法。音频高层语义分析对人们理解音频内容具有重要意义。多媒体传感器网络中,节点计算能力有限且背景噪声复杂,因而传统的用于影视节目的基于机器学习或基于逻辑规则的高层语义分析方法不能直接应用于多媒体传感器网络。在本文中,我们提出了一种基于神经网络的音频高层语义分析方法。我们首先选取足够的训练样本对神经网络进行训练,之后,利用先验知识对神经网络的参数进行调整,将机器学习和人们的先验知识进行了有效地结合。通过这种方法,我们能够准确地提取多媒体传感器网络中的音频高层语义信息。(4)验证系统的设计与实现。为了验证本文研究成果的有效性,我们基于本实验室开发的多媒体传感器网络原型系统设计了多媒体传感器网络中音频语义分析的验证系统。并将基于可鉴别主成分分析的音频特征选择方法、基于加权关联图的音频元素检测方法和基于神经网络的音频高层语义分析方法部署到该验证系统上,在交通环境和会场环境下提取音频语义信息。实验证明,本文提出的方法能够在多媒体传感器网络中对音频语义信息进行准确地分析。

其他文献

先进调制格式的产生及其全光信号处理

先进调制格式因其在频谱利用率和抗色散或抗非线性上的优异性,成为了未来光通信系统中最有潜力的技术之一,而全光信号处理是未来高速大容量全光交换网络的关键技术。目前,全

学位

先进调制格式全光信号处理正交调制半导体光放大器XGC效应2R信号再生

张大德调任鞍钢集团总工程师,不再担任攀钢党委书记、董事长

2月10日,鞍钢集团公司在攀钢南山宾馆召开攀钢干部大会,宣布鞍钢集团公司关于攀钢领导班子调整的决定：张大德同志任鞍钢集团公司总工程师,不再担任攀钢党委书记、董事长职务.

期刊

鞍钢集团公司总工程师党委书记董事长攀钢领导班子调整宾馆职务

肿瘤营养治疗的若干问题

<正>~~

会议

我看见

我看见广袤平原上的一棵树　　孤独却拒绝荒凉　　我看见蜿蜒小徑旁的一株草　　平凡却不失昂扬　　我看见山脚老村里的一盏灯　　昏暗却照亮前方　　我看见和煦的风　　温暖的阳　　我看见你　　站在熟悉的一条街旁　　我看不见　　汾水的魑魅魍魉　　龙山的隐隐幢幢　　和我远去的迷迷惘惘　　岁月静好，现世刚强　　（作者单位：同煤集团）

期刊

基于多变量多项式的公钥密码方案研究

多变量公钥密码系统作为一种可替代RSA和ECC以抵抗基于(Shor算法)量子计算机攻击的新型公钥密码体制,近些年引起人们极大的兴趣。该体制的安全性是基于求解一组多变量多项式

学位

公钥密码系统密码分析多变量中间域

孩子在为谁而玩

一群孩子在一位老人家门前嬉闹，叫声连天。　　几天过去，老人难以忍受。于是，他出来给了每个孩子25美分，对他们说：“你们让这儿变得很热闹，我觉得自己年轻了不少，这点钱是对你们表示谢意”。　　孩子们很高兴，第二天仍然来，一如既往地嬉闹。老人再次出来，给了每个孩子15美分。他解释说：自己没有收入，只能少给一些。15美分也还可以，孩子们兴高采烈地走了。　　第三天，老人只给了每個孩子5美分。孩子们勃然大怒：

期刊

孩子老人人发

基于元认知理论的主体学习者身份构建策略

随着学习型社会和终身教育体系的建立,主体学习者身份构建已成为不可回避的课题。元认知理论通过揭示基础知识对自主学习者的导向作用、元认知体验对自主学习者的反馈作用及

期刊

元认知理论主体学习者身份构建策略探析

钟山外贸老将出任商务部部长

2月24日,接替高虎城,钟山就任商务部部长.1992年钟山就任浙江省服装进出口公司总经理,他大胆改革,把公司改造成为中国外经贸企业中第一家股份制企业-浙江中大集团股份有限公

期刊

商务部部长钟山进出口公司股份制企业外贸2008年外经贸企业中大集团

血浆脑钠肽浓度与高血压患者左室肥厚及心功能的关系

目的观察高血压患者左室肥厚与血浆脑钠肽（BNP）浓度的关系，分析氯沙坦钾片治疗前后左室肥厚及左室舒张功能不全的变化情况，探讨血浆BNP浓度可否作为判断左心室肥厚的逆转及左室舒

期刊

高血压左心室肥厚脑钠肽hypertensionbrain natriuretic peptideleft ventricular hypertrophy

高校学报积极搭建学术平台为教学科研服务

摘要：高校学报是高校教师及科研人员学术研究成果展示的平台，也是学术交流的纽带，更是提升高校教师教学水平和科研实力的有效途径。高校学报应积极搭建好学术研究的平台，努力为高校教师和科研人员服务，以提升高校的教育教学水平和科研能力。　　关键词：高校学报;平台;教学;科研服务　　中图分类号：G642 文献标志码：A 文章编号：1674-9324（2015）35-0005-02　　一、前言　　据统

期刊

高校学报平台教学科研服务

多媒体传感器网络中音频语义分析方法的研究

与本文相关的学术论文