基于深度学习的监督性语音分离研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户:dorothyhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与人交流的最重要方式,也是最重要的信息载体之一。语音分离指将目标语音从背景噪声中分离出来,对提高语音质量和感知清晰度具有重要意义,可广泛的应用于移动语音通信,自动语音识别以及助听器设计等领域。近些年,将语音分离看作是监督性学习问题,使用监督模型学习从带噪语音到目标语音的映射,受到了国内外许多学者的关注,并取得一定的研究进展。本文基于监督学习算法,提出使用深层神经网络作为监督学习模型实现从带噪语音到目标语音之间的映射,完成语音分离任务。首先,使用深度神经网络(DNN)作为监督学习模型实现语音分离任务。为提高监督性语音分离在多种训练目标下的分离性能,提出一种基于特征组合的多目标监督性语音分离方法。针对声学特征之间的不同特性,提取多种典型的时频域声学特征,采用group lasso方法对这些特征进行选择及组合,得到一组特征组合向量;利用DNN模型在不同信噪比环境下完成组合特征在多分离目标下的语音分离实验。实验证明,特征组合显著的提高了监督性语音分离系统的分离性能,且在多种训练目标下都显示出了可行性与优越性。其次,使用卷积神经网络(CNN)作为监督学习模型对语音分离进行研究与实现。针对DNN全连接结构的复杂性及过渡依赖特征提取等问题,提出一种基于简单帧级别的CNN语音分离架构和方法。利用CNN卷积层的信息挖掘能力,充分发挥语音信号上下帧间的结构信息,学习语音信号的深层特性。提取Gammatone滤波域的多分辨率耳蜗图(MRCG)并进行上下帧扩展作为输入特征,通过设定CNN模型和DNN模型的对比实验,在不同信噪比和不同分离目标的条件下,完成语音评价指标的计算。实验结果验证了基于CNN的语音分离方法具有更高的分离性能和更低的时间复杂度。最后,使用粒子群算法改进卷积神经网络的BP算法,并应用于监督性语音分离中。针对卷积神经网络训练过程中用于反向传播的BP算法具有易陷于局部最优和泛化性差等缺点,使用粒子群代替BP算法进行网络权值的更新迭代。同样通过不同信噪比和多种分离目标完成两种语音分离指标的计算,验证粒子群改进卷积神经网络在语音分离中的优越性,提高语音分离系统的分离性能与泛化能力。
其他文献
目前,很多机械产品生产型企业的普通机床年代一般较长,由于长时间磨损,其加工精度下降得厉害,加上该类型机床不能实现批量生产,且生产效率低,故已不能满足正常的生产需求;但这部分机床的床身、导轨等结构还保存较为完好,从节约成本和最大化程度上充分利用现有资源原则出发,可以对相应的设备进行数字化控制升级改造;而改造后的数控机床具有较为高的加工精度和加工效率,能实现批量自动化生产,降低对人工操作的依赖等特点;
随着无线通信技术的飞速发展与不断进步,功率放大器(简称PA)的线性度越来越成为无线通信系统的一个重要指标。为了提高PA的工作效率,使PA工作于接近饱和区(非线性区),当PA工作在非线性状态时会产生带外频谱扩展,导致邻道信号干扰,在带内影响传输信号质量,导致传输失真进而增加了误码率等。运用数字预失真(简称DPD)技术解决功放失真问题已然成为一种行之有效的技术手段。由于不同的PA具有不同的特性,导致P
背景:白血病通常被认为是一种克隆性干细胞疾病,在这种疾病中,自我更新的白血病干细胞(Leukemia stem cells,LSC)被认为是启动肿瘤形成的一个重要因素。目前,使用细胞毒性药物来破坏癌细胞的化学疗法是最有效的治疗方法。然而,多药耐药性(Multidrug resistance,MDR)是肿瘤难以治愈的重要原因,是癌症治疗中亟需解决的主要问题。其中,白血病干细胞的存在是导致白血病多药耐
随着通信技术的进步,无线通信在信息化社会建设中发挥着越来越重要的作用。信道均衡是保证无线通信系统可靠性的重要手段之一,是无线通信技术的研究热点。常模算法(Constant Modulus Algorithm,CMA)由于具有结构简单、易于实现和无需训练序列等优点,在无线通信中得到了广泛的应用。不过在实际的无线信道中存在Alpha稳定分布噪声,导致传统的常模算法在这类噪声中的性能会严重下降。为提高盲
近年来,随着电子科技技术的进步,传感器的需求也在逐年提升。为了应对复杂环境中的传感,需要研发低成本、易于制备,抗干扰能力强的传感器。近年来基于氢气的清洁能源得到重视和发展,因此氢气传感器需求广泛。由于传感器由敏感材料及其信号调制电路组成。因此论文分为两部分,第一部分为氢气传感器的研究,第二部分为传感器电路的设计。虽然钯-基氢气传感器的研究已有几十年的历史,但金属钯吸收氢气引起的体积膨胀导致钯颗粒的
随着红外探测技术的迅猛发展,高精度和高灵敏度红外探测技术形成的空中和地面的全方位、全天候侦察对战场上的军事目标造成巨大的威胁,红外隐身技术的研究和发展迫在眉睫,尤其是自适应红外隐身技术。目前,以电致变发射率材料为核心的自适应红外隐身系统在昼夜温差大的场所无法满足应用要求,相比而言,以电致变温材料为核心单元的自适应红外隐身系统则具有明显优势。本文采用电制冷变温系统为核心的自适应红外隐身技术提供一种新
伴随经济社会的发展和科学技术的日新月异,科技与养老事业日益融合。老龄化是全球共同的话题,在老年人养老观念和养老方式已经转变的情况下,独居老人和进入养老院的老人数量日益增加,为了让身体衰弱的老人在室内发生不可预知的意外状况后,能够被及时发现,如何合理地为老年人提供监护服务已成为当今社会的一项挑战。监护护理人员的缺少,监护模式不合理,监护系统功能不够全面,这些都已不能更好适应现代社会发展。当养老监护服
相对于传统电学传感器,光纤传感器具有微型化、高灵敏度、抗电磁干扰、抗腐蚀、结构紧凑等诸多优点。目前,基于通信光纤的近红外光纤传感器已经被广泛应用到航空航天、石油化工以及结构健康监测等领域。而中红外光纤传感器的发展则要落后于近红外光纤传感器的发展,其主要是受限于中红外激光源的研制。近些年,随着量子级联激光器的商业化,中红外光纤传感器在生物化学分子的检测上引起了广泛的关注。硫系玻璃光纤作为唯一可覆盖中
灿烂弧菌(Vibrio splendidus)是海水养殖动物的主要致病菌,由该菌引起的刺参“腐皮综合症”具有传染面积大和死亡率高等特点。Ⅲ型分泌系统(T3SS)分泌病原菌重要的毒力因子,这些毒力因子通过T3SS的针状复合物直接输送至宿主细胞内,进而干扰细胞功能和裂解细胞导致宿主发病。然而,迄今为止尚未见有关灿烂弧菌分泌系统及其效应因子功能的研究。本研究针对灿烂弧菌T3SS的ATPase及其效应因子
CD3分子是T细胞膜上的重要分化抗原(cluster of differentiation,CD),和T细胞受体(TCR)构成CD3-TCR复合体,其对免疫信号传导及抗原识别有十分重要的作用。CD3ε是CD3复合体的重要组成部分,CD3ε与抗体的结合会对T细胞产生显著的生物学效应,因此成为优质的抗体药物靶标。CD3ε的抗体可作为Ⅰ型糖尿病、器官移植排斥等自身免疫性疾病的药物。此外,CD3ε双特异性