基于GMM的办公室环境下两类异常声音识别的研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:oikikukka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于科学技术的持续发展,特别是信息化和网络化的高速发展,人们的生活水平得到了巨大的改善。与此同时,随着城市化进程的加速,信息安全问题已经成为了社会关注的焦点,无论是国防领域还是社会安全领域,安防监控所起的作用越来越明显。作为信息载体之一的声音在日常生活中分布广泛。由于声音信号的多样性、不确定性和模糊性,对声音信号的研究一直是一个具有挑战性的学术领域,尤其是声音识别领域的研究。声音是能够表征环境状况的一个重要信号,和视觉信息相比,声音可以传达视觉范围外的环境状态信息。除此之外,出于对个人隐私的保护,音频监控作为智能监控的一个分支在特定环境下,能有效描述和揭示异常状况,因此研究办公室环境下的异常声音信号特征对智能监控和安防有着重要意义。论文针对办公室环境下几种异常声音的监测问题,分别研究了监测系统的硬件实现方案、识别算法、仿真测试及数据分析几个方面问题,最终通过实验结果以及数据分析总结出在夜间办公室环境下基于高斯混合模型(Gaussian Mixture Model, GMM)模型异常声音识别系统对几种特定异常声音(摔门声,尖叫声)达到理想识别效果的参数设置方案。论文分析了办公室环境下实现嵌入式音频采集终端的功能需求,研究了Tiny6410音频采集硬件电路模块及驱动的设计方案,在开发的音频采集应用程序基础上完成了异常声音采集,并为办公室环境异常声音库采集原始音频数据。论文在调研国内外声音识别技术的基础上,基于Matlab环境和GMM模型建立办公室异常声音识别仿真系统,对办公室环境下的两类异常声音进行比较详细的研究和大量的仿真实验,包括对异常声音的时域和频域分析、动态时间规整(Dynamic Time Warping, DTW)模型训练和识别以及GMM模型训练和识别。其中涉及到的特征参数主要有短时能量(Short-Term Energy, STE)、梅尔频率倒谱系数(Mel-Frequency Cepstral Coefficient, MFCC)和它们的一阶差分以及它们之间的加权组合。利用以上结果,通过大量的图表分析,分别在不同样本数、GMM阶数、特征参数、帧长和帧移等参数下对识别率和训练时间进行比较,得到办公室环境音频监测系统的理想参数选择方案。最后,在本文的结尾对论文工作进行总结,提出了论文中的不足之处以及待完善和改进的地方,并对环境声音识别系统的未来发展前景进行了展望。
其他文献
随着社会的发展和进步,更加重视社会管理公共服务。而在社会公众管理方面,城市社会中介组织发挥着重要的作用。本文以城市社会中介组织的特点为着眼点,探讨了社会公共组织的
本文主要介绍了在经济贸易全球化和信息技术日新月异高速发展的大环境下,面对内外部市场日益激烈的竞争,企业构建自己网站的意义和必要性,阐述了构建网站的一般过程,为企业构建网
教师倾听艺术是教学艺术的重要组成部分,是教师复杂的生理活动和心理活动过程,要求教师听得巧妙,听得有效。《义务教育语文课程标准》(2011年版)中提出:“语文教学应在师生平
目的:观察曲普瑞林治疗女童特发性中枢性性早熟(ICPP)的临床疗效,为ICPP的临床治疗提供依据。方法:应用曲普瑞林对29例ICPP女童进行治疗,观察治疗前与治疗后的第二性征、卵巢
电影这门艺术在现代社会生活中随着经济发展,已经成为人们精神生活中必不可缺的一部分。而其艺术表现形式及手法也随着科技的发展,电影的表现形式也随之多元化。动态视觉的形
借鉴现代训练理论、运动生理学理论,通过科学调控学员训练中的心率和外部表征的方法,对体能训练量和强度进行调控,实现学员体能达标训练的科学化、规范化,促进学员的身心素质
按日计罚制度兼顾了环境法律的严格性和可能给企业带来的经济负担这两方面的因素,彻底改变了“守法成本高,违法成本低”的错误观念.而且,我国《环境保护法》明确规
会议
连续SiC纤维增强Ti2AlNb基复合材料(SiCf/Ti2AlNb)在航空动力系统的高温构件中有着巨大的应用潜力。目前采用基体涂层法制备SiCf/Ti2AlNb复合材料,并分析其微观组织、界面反应
板壳类金属结构是各类装备中常见的结构形式,对该类结构进行健康监测是实现装备结构完整性监测的重要内容。疲劳裂纹是板壳类金属结构的主要损伤形式之一。实现疲劳裂纹的早
污泥作为一种具有可资源化和环境危险性双重特征的固体废弃物,如何妥善处理使其环境风险降低的同时充分利用其中的有益组分是未来亟待解决的问题。污泥热解技术是目前最具潜