【摘 要】
:
移动终端如何获取优质的音频信号,具有现实研究意义。利用麦克风阵列进行语音增强,相比于传统单麦克风降噪方法有明显的优越性。麦克风阵列中麦克风放置的位置不同,拾取到的
论文部分内容阅读
移动终端如何获取优质的音频信号,具有现实研究意义。利用麦克风阵列进行语音增强,相比于传统单麦克风降噪方法有明显的优越性。麦克风阵列中麦克风放置的位置不同,拾取到的语音信号会有所差异。这相当于增加了一个空间域,结合传统时域和频域的分析,为语音信号的处理提供更多研究角度。理论上讲,麦克风阵列的结构越庞大,麦克风数量越多,语音增强的效果会越好。但对于移动终端这样的小型且功能多样的设备,由于尺寸、功耗、成本等原因,阵列中麦克风的数量必须有所限制,这为麦克风阵列语音降噪的研究增加了难度。本文基于移动终端的小型麦克风阵列研究降噪算法,麦克风数量限制在2至4个。由于目前在移动终端的多麦克风降噪技术均是根据不同的手机应用软件,打开不同的两个麦克风,其本质依然为双MIC降噪,所以本文着重进行双MIC的理论研究。本文的算法研究分为两个平行的方案。方案一为基于语音端点检测和改进的最小均方误差的算法研究。通过语音端点检测,检测出无话语音帧,作为噪声估计的参考。另外引入Sigmoid函数对最小均方误差(Least mean square,LMS)算法的收敛因子进行了改进,更好地平衡了收敛速度和稳态误差这一矛盾。方案二为基于独立成分分析(Independent Component Analysis,ICA)和二值时间频率掩蔽算法研究。由于移动终端的麦克风拾取的语音信号会存在延时、多径反射等情况,可以利用卷积ICA对信号进行处理。但ICA在声源数量大于麦克风数量的情况下很难通过混合矩阵将独立成分分离,对于这种欠定情况,方案二将经过卷积ICA处理的信号,再经过二值时频掩蔽做稀疏处理,迭代计算至达到主信号和噪声的分离。经过仿真研究表明,本文所使用的两个方案取得了比较满意的输出波形。方案一所提出的算法时间复杂度低,有较好的语音降噪效果,并克服了现有移动终端的多MIC降噪算法的输出信号音量减弱的缺点;方案二所提出的算法更适合背景噪声有明显的非高斯信号的其他人说话声的情况。
其他文献
车辆路径问题是物流配送领域涉及到的典型问题,也是组合优化领域最为重要和流行的研究问题之一。本文研究有能力约束车辆路径问题(CVRP)。首先以数学规划模型为基础,针对CVRP
电磁层析成像及检测技术(Electromagnetic Tomography and Sensing Technology)以其检测速度快,无接触,无辐射以及成本较低等特点,而在工业过程参数检测、生物医学等领域有着
从自然界普遍存在的同步现象及同步在控制领域中的现实意义出发,本文结合了图论、矩阵论、机器入学以及系统控制等方面知识,基于输出调节理论,对复杂网络线性系统的同步问题
滑模变结构控制作为现代控制理论中的重要分支之一,以其物理实现简单、对系统内部参数的不确定性以及外部干扰不敏感的优点在线性系统和非线性系统的控制中得到了广泛应用。
随着互联网技术的快速发展,人们对数据的传输速率和传输质量有了更高的要求。但是,在目前的射频通信领域中,因为数据信息传输需求迅速增加,让有限的频谱资源更加短缺。因此,
超流体陀螺是基于低温物理技术的新型陀螺,特别是4He超流体陀螺在精度、体积、环境要求等多方面有着极高的应用潜力,目前大多仍处于物理原理研究阶段,还需要进一步对其向陀螺仪
随着电力电子技术、微电子技术、DSP技术和现代电机控制理论的发展,采用高性能控制策略的全数字化永磁同步电机伺服系统得以迅速推广。由于交流永磁同步电机为强耦合的非线性
H.264/AVC是ITU-T VCEG和ISO/IEC MPEG联合制定的视频压缩标准,目前被广泛应用于视频播放与通信中,它和正在制定中的下一代视频编码标准HEVC (High Efficiency Video Coding)均
电池能量存储系统是新型智能微电网的能源缓冲器与纯电动汽车的动力源,在众多储能介质中,锂离子电池由于其功率密度与能量密度高、循环寿命长、自放电率低以及价格适中等优势,在微电网和纯电动汽车中得到了广泛的应用。但由于储能锂离子电池系统是由成百上千个锂离子电池单体组成的一个极为复杂的系统,其具有高度非线性、温度敏感特性、明显的老化特性以及不一致性等,这些特性使得锂离子电池储能系统的监测与控制都面临诸多挑战
在石化行业为代表的流程企业综合自动化系统中,MES (Manufacturing Execution System,生产执行系统)对从生产过程控制、管理和经营管理活动中产生的信息进行收集、加工、转换