多说话人场景下的麦克风阵列语音增强算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:andykoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年随着智能化产品的普及,通过语音等方式实现人机交互受到了广泛的应用和关注,以智能音箱为代表的智能家居产品在人们的生活中扮演了重要的作用。随着智能产品的应用场景越来越丰富,语音交互的环境也越来越复杂,尤其在室内家居、会议室、办公室等多说话人场景下,干扰说话人的存在影响了目标说话人的语音质量,降低了目标说话人的语音交互体验。语音增强的目的是从受到干扰的语音中提取相对纯净的目标语音信号,是人机语音交互的关键技术之一。由多个麦克风按照一定几何形状组成的麦克风阵列能够形成对准期望方向上的波束,增强目标语音信号的同时抑制其他方向来的干扰信号,相比于单麦克风能够有效提高语音质量,目前已经被广泛应用到音视频会议产品、智能家居以及智能车载系统当中。麦克风阵列的主要研究方向为声源方位估计和语音增强。本文针对室内人机交互中多说话人的场景,由于干扰说话人的存在而影响目标语音信号质量的问题,提出了一种新的多说话人方位估计算法和波束形成算法,并通过实验验证了本文提出的算法的性能。本文的主要工作如下:1.针对常见的方位估计算法如时延累加(Delay-and-Sum,DS)算法、联合可控响应功率和相位变换(Steered Response Power with the Phase Transform,SRP-PHAT)算法、到达时延差(Time DifferenceofArrival,TDOA)算法和压缩感知-正交匹配追踪(Compressed Sensing-Orthogonal Matching Pursuit,CS-OMP)算法在多说话人场景定位精度下降问题,通过将多说话人定位问题转化为对信号的联合稀疏重构问题,提出分布式压缩感知-同步正交匹配追踪(Distributed Compressed Sensing-Simultaneous Orthogonal Matching Pursuit,DCS-SOMP)算法,仿真和实验结果表明该算法能够提高多说话人场景下的方位估计能力。2.基于深度学习并结合混合训练,以期望信号的傅里叶对数幅度谱形式的空间指向目标函数作为优化目标,做麦克风阵列期望方向空间指向特性的深度学习优化。通过实验验证了该方法在多说话人场景下改善阵列波束形成能力的有效性。
其他文献
目的:本课题组先前的研究评估了特异性靶向TNFR1受体的单靶点探针18F-AlF-NOTA-WH701在荷瘤鼠模型上的PET/CT成像效果。为了提高肿瘤摄取,改善肿瘤成像效果,最终达到治疗目的,拟构建融合肽同时靶向TNFR1和整合素αvβ3 受体诊疗一体化探针 18F-AlF/177Lu-NOTA-Gly3-E(2PEG4-RGD-WH701)用于乳腺癌的显像与治疗。方法:利用 NOTA 合成化合
伴随着激光技术的不断发展和完善,利用激光作为光源的激光探测技术现如今已经成为各类传感领域中重要的技术手段。而在各类激光传感技术中,基于激光自混合干涉(SMI)效应的传感手段由于其具有光路结构简单易准直、可判断目标物体运动方向以及对激光源要求相对不高等优点,而备受国内外广大科研工作者的青睐。在经过了几十年的发展,目前激光自混合干涉效应的相关理论已经趋于完善,并且基于自混合现象的应用已经广泛地涵盖了振
肝脏是机体代谢外源因素的主要功能性器官,极易造成肝毒性,损伤肝脏并进一步发展成为肝脏慢性及恶性疾病,现已造成了严重的公共卫生学负担。由于肝脏具有丰富的细胞组成,由多细胞间信息传递形成的细胞间通信网络,与肝脏的病理生理进程密切相关。细胞外囊泡(Extracellular Vesicles,EVs)指由细胞在正常或外源因素暴露状态下释放的一组纳米级球状膜性囊泡,其可负载源细胞特异的蛋白、脂质和核酸等信
目的:探讨单侧单节段神经根型颈椎病患者行颈椎前路椎间盘切除减压融合术(ACDF)与人工颈椎间盘置换术(ACDR)近期疗效,得出相应结论为进一步指导今后临床工作提供有循证医学证据的研究资料。方法:在2013年1月到2017年10月期间,回顾性分析共有46位符合纳入标准的单侧单节段神经根型颈椎病患者接受了外科手术治疗。所有患者手术均由同一位主刀医师完成,其中行颈椎前路椎间盘切除减压融合术(ACDF)有
盐胁迫严重威胁着农业生产和粮食安全。水稻由于其特殊的栽培方式已经成为盐碱地改良的先锋作物。然而目前生产上种植的水稻品种耐盐性较低,限制了利用水稻进行盐碱地改良的潜力。因此筛选高耐盐水稻种质资源、克隆耐盐基因对于耐盐水稻品种培育和盐碱地开发利用具有重要意义。本研究对收集的种质资源进行了多个发育时期的耐盐性鉴定,筛选出一个全生育期均具有较强盐胁迫耐盐性的种质资源—金安稻,分析了其耐盐生理机制,初步定位
蛋白质是生命活动的执行者,它们可以结合多种类型的配体,如脂肪酸、金属离子、药物和表面活性剂等。其中,表面活性剂和药物这两类物质是我们日常生活中广泛接触的。蛋白质与表面活性剂之间所形成的蛋白质-表面活性剂复合物不仅在化妆品研发和食品安全等领域中有着重要的应用,而且它还可以模拟人体内的生物系统;而研究药物在生理条件下与蛋白质之间的相互作用,有利于帮助我们了解药物在人体内的结合、吸收、代谢等机理。因此,
研究背景N-酰基乙醇胺水解酸酰胺酶(NAAA)催化内源性抗炎脂质介质棕榈酰基乙醇酰胺(PEA)的水解失活。多项研究显示,抑制NAAA蛋白活性可通过提高内源性PEA水平,激活脂质过氧化物酶增殖物激活受体-α(PPAR-α)发挥抗炎作用。本课题组在前期研究中已经在多种细胞模型上证明了新型恶唑烷酮酰亚胺类NAAA抑制剂F215、F96的抗炎作用,但是,NAAA抑制剂针对临床炎性疾病如骨关节炎(OA)和干
目的:伽玛刀治疗原发性三叉神经痛(primary trigeminal neuralgia,PTN)的疗效被广泛认可,目前研究对影响术后疗效的相关因素尚未被明确阐明。本课题探索PTN患者首次伽玛刀治疗的临床疗效及影响预后的相关因素,为临床医师在制定PTN个体化治疗方案时提供参考依据。方法:本文为单中心回顾性病例研究。研究者收集本院2014年10月至2018年12月首次接受伽玛刀放射外科(Gamma
碳化钽(TaC)因其高熔点、高弹性模量和高硬度被认为是超高温陶瓷(UHTC)中的重要组成部分。这些特性使TaC可以在航空航天、冶金和机械等领域进行高温应用。然而,与其他UHTC材料类似,TaC在高温下的抗氧化性较差,通过引入第二相SiC制备超高温复相陶瓷材料的方法可以有效地解决上述问题。而当陶瓷中的晶粒尺寸降低到纳米尺度时,体系各组分可以更好地发挥作用,从而使陶瓷整体的性能(如热机械性能和抗氧化/
目的:回顾IVF术后双胎妊娠的孕产妇资料,对比阴道分娩和剖宫产分娩的母婴结局,分析影响阴道分娩及其母婴不良结局的因素,研究IVF术后双胎妊娠经阴道分娩的安全性,指导IVF术后双胎妊娠孕产妇的临床管理及处置,以进一步提高IVF术后双胎妊娠的分娩质量。方法:收集2015年1月至2020年1月在我院产科分娩的所有IVF术后双胎妊娠的孕产妇资料,排除资料信息不全者,根据纳入标准,将91例经阴道分娩者作为观