【摘 要】
:
随着人工智能领域的发展,语音交互技术逐渐成为人工智能发展的重点研究对象。麦克风阵列技术可以在复杂的声学环境中进行噪声抑制,提高语音质量和可懂度。由于麦克风的数量、体积及运算速度等条件的限制,大多数基于麦克风阵列的语音增强算法不能直接应用于便携式终端设备中。差分麦克风阵列(Differential Microphone Arrays,DMA)因为其具有超强方向性、波束模式频率几乎不变以及体积小的特点
论文部分内容阅读
随着人工智能领域的发展,语音交互技术逐渐成为人工智能发展的重点研究对象。麦克风阵列技术可以在复杂的声学环境中进行噪声抑制,提高语音质量和可懂度。由于麦克风的数量、体积及运算速度等条件的限制,大多数基于麦克风阵列的语音增强算法不能直接应用于便携式终端设备中。差分麦克风阵列(Differential Microphone Arrays,DMA)因为其具有超强方向性、波束模式频率几乎不变以及体积小的特点得到了充分重视和广泛研究。本文主要研究了基于一阶差分麦克风(First-order Differential Microphone,FDM)阵列的双通道语音增强技术,并针对传统算法的不足做出了改进。具体内容如下:首先,对基于FDM阵列技术的双通道语音增强方法(简称FDM-SS)进行研究分析。发现经该算法处理得到的增强语音信号中存在方向性噪声残留,并且当对测试语音的静音段估计不精确时会造成语音质量的下降。其次,针对FDM-SS算法处理后增强语音信号存在方向性噪声残留的缺陷,提出了基于差分麦克风阵列的变步长LMS(Least Mean Square)语音增强算法。该算法对两个麦克风采集到的带噪语音信号进行一阶差分麦克风阵列处理,将获得的语音通道信号和噪声通道信号分别作为期望信号和误差信号与变步长频域LMS算法相结合,控制自适应滤波器的权系数进行调整。实现对语音通道信号中的方向性噪声残留进一步消除。仿真实验结果显示,提出的改进算法能够对方向性干扰噪声进行有效地抑制,提高语音质量。最后,针对广义旁瓣对消(Generalized Sidelobe Cancellation,GSC)结构中存在BM模块在低频段会丢失语音信号的缺陷。结合一阶差分麦克风阵列的优势,提出了基于一阶差分麦克风阵列的改进GSC算法。该算法将差分麦克风阵列处理后的语音通道信号和噪声通道信号分别作为GSC的固定波束形成器(Fixed Beamformer,FBF)模块和阻塞矩阵(Blocking Matrix,BM)模块输入。并增加一个BM模块通过均衡滤波器对低频部分的能量丢失进行补偿,提高自适应噪声相消器(Adaptive Noise Canceller,ANC)的性能。利用两通道信号对先验信干比(Signal-to-Interference Ratio,SIR)进行估计,从而控制ANC自适应滤波权系数进行更新,消除语音通道信号中残留噪声。实验结果表明,提出的算法可以有效地克服方向性噪声并减少语音信号的失真,语音质量客观评估及降噪效果都优于参考算法。
其他文献
语义分割是图像理解的关键部分,是一项基础的计算机视觉任务,其广泛应用于自动驾驶、医疗图像分析、智能监控等领域。现有的语义分割方法大多数都是全监督语义分割方法,全监督语义分割方法需要大量的像素级标注来训练语义分割网络,然而获得大量具有像素级标注的图像集需要很大的时间和人力成本。为了降低人力和时间昂贵的成本,研究者们提出弱监督语义分割方法。弱监督语义分割方法仅仅只需要图像类别等弱标签去训练分割网络,所
室内火灾复杂多变,在应对完全未知的复杂室内环境时,传统人工势场法因为自身缺陷很难成功完成路径规划的任务。近年来,深度学习和强化学习在不断的向前发展,用深度强化学习的方法来实现智能体路径规划任务一直是前沿热点研究。传统的人工势场法应用到复杂的、未知的环境时,会因为目标不可达或局部极值点等原因导致寻路失败。而深度强化学习是通过让智能体在不断“犯错”的过程中,学习到相关躲避障碍物以及寻找目标点的策略,最
在智能化时代背景下,随着智能化的发展,机械手搭载视觉系统就相当于让机械手拥有了“眼睛”,促进工业制造更加智能化、柔性化。工业现场经常需要完成对无序堆叠零件定位的工作,由于单目视觉不能较好的解决这个问题,因此需要依靠人工或者振动机构将无序堆叠零件平整放置,然后利用单目视觉进行后续操作,影响了生产效率,增加了制造成本。为提高企业的生产效率,促进自动化的进一步发展,本论文针对无序堆叠问题开展了基于双目视
互联网高速发展,使得出现了一大批新型产业,其中电商是收获最大的产业。电商通过整合和分析数据,提供个性化的推荐服务给消费者,其新颖、便捷等特点吸引了大量的消费者。然而实体零售企业由于自身设备、数据标准不统一或其他原因,无法实现企业间的数据共享,无法优化自身服务,导致无法留住消费者。因此,为了改变实体零售企业存在的困境,需要一个安全共享数据平台。然而传统的大数据交易平台是第三方平台,其存在着成本高、收
随着汽车工业和物联网技术的飞速发展,车载应用与服务日渐丰富给计算资源有限的车辆造成了很大的困扰。针对车联网“低延时、高带宽、高可靠性”的严格要求,将移动边缘计算(Mobile Edge Computing,MEC)技术引入是一个很好的解决方案,MEC将云计算服务下沉至无线网络边缘侧,在车载终端附近能够提供计算服务,从而弥补了云服务器远程传输过程带来的延迟干扰,更容易满足用户服务质量。目前,学术界和
目前,无线传感器网络(Wireless Sensor Networks,WSN)已成为第四次工业革命的技术制高点,是由大量的传感器节点等通过自有方式构成的一种无线通信系统。这种网络可以利用传感器节点来监测处于各种地理区域中的相关物理或环境信息,将对人类的生产生活方式带来巨大变革。然而,其运行分布恶劣动态性强的广域环境,存在各类突出问题,如断续链接、网络效率低下等,使得WSN的应用环境及相关条件受到
随着现代生产向自动化、连续化、智能化和高效化发展,相应的生产设备需安全可靠且连续运转,其中设备润滑是影响生产设备安全可靠及连续运转的关键因素之一。设备的传统润滑方式是由人工定时巡检与加注润滑剂完成,不能满足现代生产的“四化”发展要求。随着计算机技术的发展,设备润滑也朝着自动化方向发展。目前设备的自动润滑有集中式和分布式两种形式,集中式自动润滑适合于润滑点位置相对集中且润滑要求相近的设备润滑场合,该
图像增强技术是图像处理领域的一种关键技术,已经渗透到了人们生活的方方面面。其中,颜色传递作为图像增强的一种重要手段近年来受到研究人员的重点关注。颜色传递技术能够将参考图像的颜色特征传递至内容图像上,使结果图像在拥有内容图像结构特征的同时又具备参考图像的颜色特征,从而可以较好地提高图像的艺术风格和视觉效果。传统的颜色传递方法往往存在细节模糊、噪声增强、层次感欠缺以及不能很好地保持参考图像的颜色特征等
第三次信息产业革命伴随着物联网的发展而兴起,在传感器和嵌入式两个技术的共同支持下,以其易于结合、容错率高、易于部署、易于增减传感器节点、执行效率和速率高等技术优势,已经应用在智能家居等诸多领域。本文将物联网引入家庭内部,设计了一个集数据采集传输、语音呼叫、移动智能监视与一体的家庭物联网系统。基于物联网技术的发展,以设计并完善家庭内部物联网系统为根本目标,本文解释了家庭物联网监控系统所涉及的基础理论
近年来,随着比特币的兴起,区块链技术逐渐走进大家的视野,其技术特性可以解决一些社会痛点问题,给人们带来很多便利。另一方面区块链技术与其他技术相结合,如人工智能、大数据等,为其应用的实现提供了无限可能。作为区块链的关键技术,共识算法保证了区块链应用的无中心化管理以及数据一致性与合法性,然而目前大多数共识算法存在一定的不足。如部分共识协议依赖权益节点,在形成共识过程中,容易产生记账节点选择问题,也易产