基于传声器阵列的音频采集与增强研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:vitchen02
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在典型的语音采集与通讯的应用中,采集到的声音都会受到各种各样的干扰,包括背景噪声、竞争话者语音、混响、远端通信传输或本地播报的声回声等。传声器阵列相比单个传声器能够利用声源的空间信息,进而较好的抑制噪声,提取期望方向的信号,因此被广泛的运用于免提通讯、助听、人机交互等领域当中。本论文主要关注传声器阵列音频/语音采集与增强,重点研究波束形成、阵列位置优化以及后处理等技术。我们分析了波束形成所一般使用的阵列模型,总结了常用的波束算法,以及波束性能评价指标。在此基础上,提出了一种用于高品质音频录音的阵列设计方案。由于高品质音频录音需要保留高频的信息,奈奎斯特定理要求其阵列间隔较小,需要较多的阵列单元。通过对阵列单元位置的优化,我们将单元个数控制在能够接受的范围,确保其工程上的可行性。并通过实验详细评测设计阵列的指向性、等效噪声级、频率响应,验证了其比同样长度的枪式传声器具有更好的性能。在阵列尺度较小且单元个数较少时,单纯依赖波束很难获得有效的语音增强效果。针对这个问题,论文探索了一种利用深度学习进行波束后处理的模型。在训练数据集的构造过程中,我们尽可能地考虑了各种声学场景,并通过不同通道之间的权值共享,使得模型具有很好的泛化能力,能够很好地处理实际测得的数据。客观指标和语音识别结果的对比表明:该方案的性能显著超过一般基于信号处理的后处理算法,有很强的应用前景。论文还总结了现有结合深度学习的语音前端信号处理的融合方案,分析了一些主流的模型,同时针对该领域将来可能的发展方向进行了一些讨论。
其他文献
在VB6中汉字加解密的原理、散列函数的构造方案,在加解密方产生散列函数的种子值初始值和用于加解密的随机序列数的方法。给出了实现一个简单的128位加解密方案的实例。
<正>一份漂亮的成绩单,让一向低调的中储股份再次成为各方关注的焦点。中储股份公布的年报显示:2011年度中储股份营业收入234亿元,完成年度预算的115%,同比增长16%。在纷繁复
2012年《行政事业单位内部控制规范(试行)》文件出台,要求行政事业单位自2014年起实行内部控制,财政部之后相继出台配套文件对事业单位内部控制建设进行指导和推动。基于这样
本文介绍了一个公众电子信箱系统的实现过程,将其涉及到的众多技术的结合与应用作了详尽的阐述,包括WEB站点的建立、Microsoft Mail邮局的设置、IIS提供的IDC通过ODBC数据源对数据库的操作以及应用PowerBuilder6.0提供的
牛津大学大学学院(University Coltege)拟扩招10%本科生,其中包括大量贫困和弱势群体等进入高等教育比例较低的人群。该学院将准备新的教学用地来接纳这些额外的学生。这些学生仍
Blips镜头从外观看来跟贴纸差不多.直接贴在设备上使用。其中微距镜头可以进行很近的特写题材拍摄:而显微镜头则将画面拉得更近.带着它就像在口袋里放了个显微镜一样。它所用的
党的十九大报告指出,要积极促进“一带一路”国际合作,努力实现政策沟通、设施联通、贸易畅通、资金融通、民心相通。习近平总书记在出席第二届“一带一路”国际合作高峰论坛时
报纸
经济放缓倒逼企业升级转型,而工业机器人将助推珠三角量大面广的制造业完成这一转型。2015年11月17日,中国机器人产业联盟的执行理事长、中国机械工业联合会常务副会长宋晓刚
利用计算机的并行接口作为替代可编程序控制器的一种方法,介绍了基于并行接口的继电器控制电路与编程方法。
经济发展新常态下的湖南,正集中精力培育、创造新的经济增长点。经济增长点对于市场需求、产业规模、增长速度、联系效应等往往存在基准条件,那么农业能否成为新的增长点?$$农业
报纸