论文部分内容阅读
人的声音是通过声波的形式进行传播,声波会引发空气的振动而引起人体听觉器官的振动,最后被其他人所听见。由人体发声器官发出的声音又被称为语音,它往往包含着一定的信息,代表着不同的含义。但是由于声波振动引起的语音信号往往非常微弱,需要进行一定的放大和恢复从而被人所听见,人们常常采用麦克风的形式,通过电路对振动进行放大。近年来也出现了光学麦克风的形式,通过激光的反射实现语音的放大和恢复。视觉测量是近些年来发展迅速的测量技术,在形状检测、目标识别和跟踪以及物体结构和运动分析等领域都实现了广泛的应用,具有非接触、全场测量等多方面的优势。高速视觉测量是视觉测量中的一种方式,可以得到频率更好的信息,适用于需要精确测量的场合。考虑语音产生的振动也是一种微小的运动,本文就能否通过高速视觉完成对于微振动的提取,实现基于视觉测量的声音恢复进行了相关的探索和研究。本文对基于高速视觉的微振动提取方法进行了研究,分析了三种不同的影像放大技术,比较其优缺点,并找到了适用于对微小运动进行放大的方法,进行了相关的仿真实验,验证了算法具有的放大效果。而后提出了一种自适应的基于奇异值分解的微振动提取方法,对子区域的选取进行了优化。它运用奇异值分解的特性,可以实现对运动特性本质特征的表达。基于微振动提取的算法,本文对语音恢复方法进行了具体的实验,首先对.整体的系统架构进行了设计,对不同的关键部分进行了相关介绍,而后在系统的基础上进行了基本实验,实现了对语音信息的放大和还原。最后针对于直接还原的结果不是非常理想的情况,提出了一种基于噪声估计的谱减法对语音信息进行优化和增强,相比于传统的谱减法实现了对于噪声较为精准的估计和分离,得到了评价良好的改进结果。本文中提出的改进了语音处理方法的基于奇异值分解的微振动提取算法,可以实现对语音的恢复并拥有良好的效果,在安防、监听等领域拥有着实际意义。同时,微小振动也包含着除了声音以外的其他很多信号,所以这样的提取和去噪方法对于同类振动信号的放大和还原也有着一定的借鉴意义。