语音分离技术的研究与实现

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户：gardeeen

【摘要】

：

语音分离技术,作为语音合成和语音识别等技术的重要基础,在语音信号处理技术中占有着至关重要的地位。传统基于单麦克风的语音分离方法在理想的无噪、无混响的环境中能够对混

【作者】

：

庞宇

【出处】

：

国防科学技术大学

【发表日期】

：

2016年期

【关键词】

：

语音分离麦克风阵列信号抵消语音活动性分类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音分离技术,作为语音合成和语音识别等技术的重要基础,在语音信号处理技术中占有着至关重要的地位。传统基于单麦克风的语音分离方法在理想的无噪、无混响的环境中能够对混合语音信号进行较好的分离,但它在多声源、高噪声环境下的分离效果并不理想。基于麦克风阵列的语音分离方法能够利用波束形成方法对目标方向的声源信号获得更高增益,并对其非目标方向进行较强的抑制,从而获得更好的语音分离性能。但对于语音而言,其明显的带宽和不稳定特性导致了语音分离方法中信号权矢量准确的获取难度远远大于传统天线阵列中平稳的窄带电磁波信号。因此,围绕如何减小语音分离过程中的信号抵消现象,论文对现有的语音分离方法进行更加细致的分析和改进。论文对一种基于双麦克风阵列的语音分离方法进行了实现和改进,并在此基础上对一种基于球面正四面体麦克风阵列的语音方法进行了设计和仿真实现。论文以基于ICA的单麦语音分离方法为参照,利用PESQ语音质量评价方法对利用上述两种算法分离后的语音质量进行了评估,结果显示所设计的方法能够实现较好的语音分离性能。论文重点对两种基于麦克风阵列的语音分离方法的实现与改进进行论述,具体地说,主要进行了如下几方面的工作:首先,论文在介绍语音分离技术的研究背景、意义、现状以及发展趋势的基础上,对基于麦克风阵列语音分离技术的相关原理进行了较为全面的阐述。讨论了语音和噪声的信号特征及语音信号在阵列处理中的难点所在。从波动方程入手,深入浅出的对方法中所涉及的远场宽带信号模型进行了推导。又对常见的麦克风阵列拓扑结构进行了简单介绍,并对MVDR波束形成方法和基于FIR滤波器的宽带波束形成方法的相关原理进行了阐述,为下步方法实现与改进奠定了理论基础。其次,论文对基于双麦克风阵列的语音分离方法进行了实现。该方法主要包含有三个部分,即语音活动性分类模块、语音分离模块和后置检查模块。其中,语音活动性模块用于自动鉴别声源的语音活动性是否处于活动状态,并将其结果发送至语音分离模块中的自动控制组件,以便控制MVDR波束形成器自适应性的开闭状态,从而正确获取语音信号的相关性;语音分离模块用于将麦克风阵列所接收到的混合语音信号进行准确分离,并且为了避免信号输出时的相位不连续现象,模块选用MVDR波束形成器与FIR滤波器相结合的方式来对宽带语音信号进行分离;后置检查模块利用输出信号的功率对之前的语音活动性分类结果进行检查和校正,以便获得更加准确的语音分离结果。再次,论文对一种基于球面正四面体麦克风阵列的语音分离方法进行了设计和仿真。其原理相似于上面的双麦克风阵列方法,不同之处在于该方法利用更多的阵元和谐波域对含噪混合语音信号进行处理,其优势在于方法对权向量、互功率谱矩阵以及阵列流形矩阵的计算相比于阵元域都为简单和准确。最后,论文以基于ICA的单麦语音分离方法为参照,利用PESQ语音质量评价标准对上述三种算法分离后的语音信号进行了质量评估,结果显示利用所设计的方法分离后的语音信号PESQ得分均值及标准差都优于前两种方法,体现出所设计的方法能够实现较好的语音分离性能。论文结尾总结了所设计方法存在的优点和不足,提出了进一步的改进方向。

其他文献

二溴荧光素-N-氯代丁二酰亚胺化学发光体系测定片剂及人血浆中的氢溴酸右美沙芬

研究发现，碱性溶液中，二溴荧光素可吸收N-氯代丁二酰亚胺（NCS）氧化氢溴酸右关沙芬反应的化学能而产生化学发光，从而构建了二溴荧光素-NCS-氢溴酸右美沙芬化学发光体系。利用该体系

期刊

化学发光二溴荧光素N-氯代丁二酰亚胺氢溴酸右美沙芬Chemiluminescence Dibromofluorescein NCS Dextrometh

温格斯坦理性选择制度主义政治学研究

温格斯坦用理性选择理论分析了制度的生成因素、维系与演化过程与影响,并把结论运用到民主制度的稳定性、有限政府、民族国家兴衰、经济增长等问题的研究,认为不同环境中的制

期刊

理性选择理论制度自我实施可信性承诺

高校理工科学生艺术思维培养研讨

为了培养高校理工科学生的艺术思维及严谨的科学思维方式,以分析理工科学生艺术思维培养的重要性为出发点,从高校理工科学生的思维特征、科学思维和艺术思维、艺术思维的培养

期刊

理工科艺术思维科学思维创新意识

检察人员分类管理研究

检察人员分类管理改革,其目的是为了突出检察人员的司法属性,淡化行政色彩,提高工作效率和质量,实现检察人员的职业化、专业化甚至精英化,从而促进检察权一体化,实现检察机关

学位

检察人员分类管理价值改革完善

基于JSP技术的网上产品订购系统的研究与实现

基于JSP动态网页设计技术而开发的网上产品订购系统具有前台登录和后台管理两大模块，其中后台管理包括：商品管理，可以对商品分类的增加、删除，商品的增加、删除、商品注册信息的

期刊

动态网页JSP数据库JDBC

碳酸二甲酯直接合成反应中新技术的运用

阐述了超临界CO2技术、CO2活化技术及耦合反应新技术在碳酸二甲酯直接合成反应中的应用,分析了合成反应存在的问题,提出了今后研究的方向。

期刊

二氧化碳甲醇碳酸二甲酯直接合成

动物源性食品中克伦特罗、莱克多巴胺和沙丁胺醇快速检测产品的稳健性评价

对市售瘦肉精三联快速检测卡进行了质量检测及稳定性评价,以期为评价和控制快速检测卡质量提供依据。根据国家规范,采用空白基质加标制备盲样,并验证盲样的均匀性和稳定性,对

期刊

瘦肉精食品安全快速检测胶体金免疫层析试纸条稳健性评价

我国旅游服务贸易与经济增长的实证分析

改革开放以来,我国旅游服务贸易与世界的交流也越来越多。本文选取我国1985—2006年旅游服务贸易的进口、出口和GDP数据,根据协整理论,分别分析了GDP和旅游服务贸易的进口、G

期刊

旅游服务贸易经济增长协整

价值澄清理论对德育课程改革的启示

<正>新一轮基础教育课程改革提出"以德育为核心,以创新精神与实践能力为重点"的素质教育总目标,它更加全面深刻地突出了德育的核心地位和作用。课程改革的实施,给学校德育工

期刊

价值澄清理论德育课程改革德育方法

临床药师对医院在经济方面的作用

卫生保健体系中,临床药师作为药物治疗专家,其日常工作室向患者和医疗工作者提供药物治疗评估和建议,是安全有效用药信息和建议的第一手资料提供者。但一直以来,药品销售都直

期刊

临床药师医院经济新医改医药分开

语音分离技术的研究与实现

与本文相关的学术论文