【摘 要】
:
语音增强是语音信号处理领域一个十分重要的研究课题,其目的在于改进带噪语音的质量。该技术不仅与信号处理理论有关,还涉及到人的听觉感知学和语音学。语音增强是一项支撑技术,对于提升其它应用系统的鲁棒性起到至关重要的作用,如目前市面上的语音识别、声纹识别等智能设备使用语音增强技术来保障其整体性能的稳定性。近年来,基于深度学习技术的语音增强方法有了长足的进步,相较于维纳滤波、卡曼滤波等传统的增强方法而言,在
论文部分内容阅读
语音增强是语音信号处理领域一个十分重要的研究课题,其目的在于改进带噪语音的质量。该技术不仅与信号处理理论有关,还涉及到人的听觉感知学和语音学。语音增强是一项支撑技术,对于提升其它应用系统的鲁棒性起到至关重要的作用,如目前市面上的语音识别、声纹识别等智能设备使用语音增强技术来保障其整体性能的稳定性。近年来,基于深度学习技术的语音增强方法有了长足的进步,相较于维纳滤波、卡曼滤波等传统的增强方法而言,在性能及普适性等方面都表现出了较大的优势。本文在以下几个方面开展了研究工作:1)基于深度学习的语音增强技术;2)语音增强技术在说话人识别系统中的应用;3)基于深度学习的信源分离技术。本论文所取得的具体工作成果包括:(1)提出了基于零相位的端到端语音增强系统针对于语音增强中相位谱估计问题,提出了零相位特征提取方案,并结合Unet神经网络设计了端到端的语音增强系统。在该系统所采用的目标函数方面,对原始的wSDR方式进行了改进,有效提升了增强的语音的效果。(2)设计并实施了具备鲁棒性的端到端说话人识别系统将上述语音增强系统与基于I-vector的说话人识别系统进行了融合,同时提出了说话人模型及其得分机制的改进方案。实验表明上述改进提升了基础说话人识别系统的鲁棒性。(3)依托上述语音增强系统,提出了一种完成信源分离任务的深度学习架构。在该架构中,结合信源分离的评价指标,优化了系统的目标函数。
其他文献
目的 观察颈椎后路单开门联合微型钛板内固定治疗多节段脊髓型颈椎病的临床效果.方法 以116例多节段脊髓型颈椎病患者为研究对象,按随机数字表法分为对照组(58例)和研究组(58例),对照组行颈椎后路单开门联合缝线固定术,研究组行颈椎后路单开门联合微型钛板内固定术,比较两组手指标差异,测定JOA评分和颈椎椎管矢状径,评价手术临床疗效,观察术后并发症.结果 两组术中出血量、手术操作耗时和术后康复训练开始时间差异均不具有统计学意义(P>0.05);研究组术后12个月JOA评分和颈椎椎管矢状径数值均显著高于对照组(
目的 观察心脏外科术后机械通气患者撤机流程再造的临床实践及成效.方法 选取120例心脏外科术后机械通气患者为研究对象,均接受品管圈质量改进工具及方法进行撤机流程再造干预,并采用特性要因图对患者术后气管插管时间长的原因进行分析,在临床查检中找出真因,并制定改进方案.结果 干预后,心脏外科术后机械通气患者气管插管时间、CCU住院日、获得性吞咽障碍发生率、患者满意度改善后均优于干预前,差异有统计学意义(P<0.05).结论 心脏外科术后机械通气患者的撤机标准流程再造的品管圈活动能缩短患者气管插管时间,促进患者快
目的 探究直肠癌患者单腔造口还纳术中不同缝合方式的效果比较.方法 随机抽取2018年2月至2021年2月本院收治的直肠癌患者63例,均开展单腔造口还纳术进行治疗,双盲法分组,实验组32例、对照组31例分别采用改良荷包缝合方式及直接缝合方式,比较两组患者手术相关指标、术前、术后炎症因子水平及并发症率.结果 实验组住院时间、术中失血量、卧床时间、伤口恢复时间、排气时间均较对照组低,有统计学意义(P0.05),术后,实验组指标水平较低,有统计学意义(P<0.05);实验组并发症率较对照组明显降低,差异有统计学意
移动通信技术的飞速发展引领了新型业务的出现和繁荣发展。尤其随着虚拟现实、自动驾驶、万物互联等概念的兴起,人们对通信服务质量提出了更高的需求。未来网络面临系统容量、用户体验速率、传输时延和资源紧缺等多方面的压力。毫米波以工作在30 GHz-300 GHz频段极大地丰富了频谱资源、缓解了移动通信系统中频谱资源短缺带来的挑战。而大规模天线技术以大规模天线阵列使用户获取高波束赋形增益,弥补毫米波信号高路径
如今,光接入网络中的流量趋势已从简单的基于Web的服务转移到了多媒体和视频服务。多播是一对多流量的转发方法之一。但是,由于它需要在路由器中存储很多状态,因此发展很少。依靠技术发展IP组播(IP MC)成为主要行业之一。在传统的多播中,它需要为每个会话维护一个路由条目(多播地址)。因此,它不能像单播一样通过前缀来聚合地址。因此,一个多播会话需要所有相关的路由器维护一个路由条目,这可能在传输过程中带来
目的 探讨三氧化矿物聚合物(MTA)修复在年轻恒牙活髓保存治疗术中的临床效果及对牙髓干细胞(DPSCs)体外增殖分化的影响.方法 行便利抽样法选取2018年1月至2019年7月期间收治于本院行年轻恒牙活髓保存治疗术的64例患者为研究对象,随机划分为研究组和对照组,每组32例.对照组行传统根尖诱导成形术治疗,研究组行MTA修复治疗.比较分析两组患者随访术后6个月修复成功率、术后12个月根尖周指数(PAI)和培养不同时间点的DPSCs体外增殖吸光度.结果 研究组术后6个月及12个月修复成功率显著高于对照组(P
目的 探讨直肠癌检测C反应蛋白与白蛋白比值(CRP/PAB)、术前纤维蛋白原与白蛋白比值(FAR)、血小板数与淋巴细胞数比值(PLR)、癌胚抗原(CEA)的临床意义.方法 选取2018年1月至2020年12月在本院进行直肠癌根治术的62例直肠癌患者作为研究组,另选择同期在本院进行治疗的结直肠良性病变患者作为对照组.对比分析两组的CRP/PAB、FAR、PLR、CEA检测值,并利用受试者应用曲线评估CRP/PAB、FAR、PLR、CEA检测的临床诊断效能,采用Cox分析法评估CRP/PAB、FAR、PLR、
目的 分析股骨颈骨折内固定术后股骨头坏死患者血清骨代谢、血管内皮生长因子(VEGF)变化及临床体会.方法 2018年10月至2020年10月,回顾性分析45例股骨颈骨折患者的治疗状况,根据股骨头坏死情况,分为坏死组(22例)和非坏死组(23例).比较分析两组25羟基维生素D3[25(OH)D3]、尿钙、尿磷、碱性磷酸酶(ALP)、年龄、甲状旁腺素(PTH)、血钙、血磷、VEGF阳性细胞及阳性血管的差异.结果 与非坏死组比较,坏死组的25(OH)D3、尿钙、尿磷水平明显降低,而ALP水平则升高明显,差异有统
目的 研究早期行腰大池引流对防治动脉瘤术后脑血管痉挛的有效性.方法 采用回顾性地分析方法,分析了2018至2020年间因颅内动脉瘤破裂而行介入栓塞术的患者资料,通过术后脑血管痉挛(cerebral vasospasm,CVS)及迟发性脑缺血(delayed cerebral ischemi-a,DCI)的发生率、住院时间、出院时GCS改善情况以及术后3个月随访GOS评分,来评估其有效性.结果 接受腰大池引流的患者术后CVS(38.64%,P=0.045)及DCI(7.55%,P=0.002)的发生率明显降
区块链作为新兴分布式存储技术,在物联网系统中的得到了广泛的应用。使用区块链作为物联网数据共享系统的底层协议,提供了宝贵数据一致性、可靠性和可溯源性。然而,物联网系统与区块链技术结合也带来了新的有待研究和解决的问题。(1)区块链系统中的每条消息都通过数字签名保证消息内容的可靠性,但在面对大量传感器消息共享场景时,会带来高昂的密钥存储和通信负担。(2)传统物联网数据共享系统的信息发布只需要单轮广播过程