音素识别技术研究与应用

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:losches
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
音素是根据语音的自然属性划分出来的最小语音单位,而音素识别技术是一种从语音音频中识别出其音素序列的模式识别技术。音素识别已经历经了几十年的发展,从传统的隐马尔可夫模型到现在的基于注意力机制的编解码模型,音素识别技术日趋成熟,识别性能已经提升到了一个很高的水平。需要进一步明确的是,音素识别技术可以作为一项支撑技术,其合理应用可以较为有效地提升其它系统的性能。本论文重点进行了两方面的研究,其一是端到端音素识别技术的改进和优化,其二是音素识别技术在按例查询型关键词检测系统中的应用。针对这两个研究方向,本论文所完成的主要工作可以归纳为如下三个方面:1.本论文对基于编解码模型的端到端音素识别技术进行了研究和优化。论文中对融入注意力机制的编解码模型进行了系统实现,同时创新性地使用了 Word2vec系统对原有系统中Embedding机制进行了改进。此外为了弥补训练数据不足的问题,论文中设计了一种基于逆映射思想的数据增补方法;同时,在系统开发过程中引入了纠正训练步骤,能够有效提升音素识别系统。2.论文中创新性地使用音素识别技术来生成关键词检测系统的特征,并依托图像识别技术完成了按例查询型关键词检测系统的开发。本论文利用上述音素识别系统来提取音素向量特征,之后利用相关性计算将音素向量特征转化为特征图像,进而使用基于深度学习的图像识别技术完成特征图像的处理,最终完成了关键词的按例查询。本论文经过系统性能实验,证明了该系统具有可行性。为了评估所开发系统的性能,本论文还设计了一个使用音素后验概率谱来生成特征图像的对比方案。该对比系统采取了多层感知机的音素识别技术来生成关键词检测所需要的音素后验概率谱,然后结合图像识别技术来进行关键词检测。本文经过系统性能实验,能够达到预期的实验效果,并通过两种系统的性能对比,证明了基于音素向量的关键词检测系统性能要优于基于后验概率谱的系统。3.本论文所完成的音素识别系统的基础上,利用模板匹配思想进一步设计和实现了一个按例查询型关键词检测系统。该系统借鉴了 D-vector说话人识别算法中的思想,依托上述音素识别系统生成关键词检测系统的摘要特征,然后利用基于滑动窗的模板匹配方法,在待测数据中确定关键词的存在并能够定位其所在位置。经过系统性能实验,该系统能够达到预期的性能效果。同时本文把该模板匹配系统和前两个基于图像识别技术所搭建的关键词检测系统做了系统性能对比,并分析了系统之间的差异。
其他文献
目的 对比分析对于剖宫产后产生的切口憩室采用不同的手术方式进行治疗的临床效果.方法 前瞻性选定2015年9月至2020年9月收治的剖宫产切口憩室64例患者作为研究对象.随机数表法分为两组,各32例.对照组采用经阴道子宫切憩室术,观察组采用宫腔镜电切憩室活瓣术.比较两组术中出血量、手术时间、术后肛门排气时间、住院时间、并发症以及术后3个月效果.结果 观察组术中出血量、手术时间、术后肛门排气时间、住院时间低于对照组(P0.05).观察组治疗有效率为90.63%,对照组为87.50%,两组无显著差异(P>0.0
目的 对膝关节前交叉韧带(ACL)及半月板损伤患者进行MRI诊断,评价其临床诊断价值.方法 选取2019年3月至2021年3月医院收治的膝关节损伤患者94例进行回顾性分析,所有患者均进行MRI检查与关节镜检查,以后者检查作为金标准,对MRI检查诊断膝关节ACL损伤、半月板损伤的临床价值进行评价分析.结果 MRI诊断膝关节ACL损伤的灵敏度、特异度、准确度分别为95.35%、87.50%、94.68%,Kappa值为0.731.MRI诊断半月板损伤的灵敏度、特异度、准确度分别为93.98%、90.91%、9
目的 探讨宫腔镜下宫腔刨削(IBS)手术治疗子宫黏膜下肌瘤的临床疗效.方法 选择2019年5月至2021年3月期间本院接诊的21例子宫黏膜下肌瘤患者纳入研究,均接受宫腔镜下IBS手术.记录术后1个月恢复情况、围术期情况以及手术前后血红蛋白、血钾、血钠水平、子宫内膜厚度的变化以及术后并发症发生率.结果 术后1个月时,所有患者术后恢复优良率为95.24%;手术时间(32.83±5.61)分钟,术中出血量(25.61±4.03);住院时间(4.13±0.57)天,阴道流血时间(4.93±0.83)天;术前、术后
目的 探讨鞘内化疗患者腰椎穿刺后头痛预防的循证护理应用效果.方法 选取2018年4月至2019年3月鞘内化疗患者130例为研究对象.采用随机数字表法分为对照组和干预组各65例.对照组采用常规治疗方案,干预组实施基于循证的头痛预防干预方案.结果 干预组患者头痛发生率和疼痛评分显著低于对照组,患者匹兹堡睡眠质量指数(PSQI)量表各维度得分显著低于对照组,差异均具有统计学意义(P<0.05).结论 基于循证的头痛预防干预方案能显著降低鞘内化疗患者腰椎穿刺后头痛发生率和头痛程度,提高睡眠质量.
近年来,全球汽车保有量的不断增加对交通安全和道路智能化水平提出了更高的要求。一方面,车载毫米波雷达被越来越多地用于各种驾驶辅助系统和碰撞避免系统中,成为车载传感器中最为重要的组成部分之一;另一方面,车联网中的车对车(Vehicle-to-vehicle,V2V)通信技术无需依赖路边基础设施单元(Roadside Unit,RSU),可为移动中的车辆节点直接提供端到端的无线通信服务,潜在地补充车载感
目的 比较硬膜外自控镇痛与静脉自控镇痛在胸科手术术后的镇痛效果.方法 选取2020年1月至2021年6月本院择期行胸科手术的患者120例,按随机数字表法分为两组(各60例).A组术后采用硬膜外自控镇痛,B组术后采用静脉自控镇痛.观察两组术后镇痛、镇静评分及不良反应发生情况.结果 术后4、8、12、24、48小时,A组静息和运动状态下VAS评分均低于B组(P<0.05),A组Ramsay镇静评分均高于B组(P0.05).结论 硬膜外自控镇痛在胸科手术术后的镇痛和镇静效果均优于静脉自控镇痛,且安全性较高.
目的 探讨肌骨超声精准引导下增生疗法治疗冈上肌肌腱病的临床效果.方法 选取本院2019年5月至2020年12月收治的60例冈上肌肌腱病患者.依据随机数字表法分为对照组与观察组,每组30例患者,对照组采用经冲击波治疗,观察组采用增生注射疗法.比较两组患者影像学评定、肩关节功能等指标.结果 察组治疗后美国肩肘医师协会(ASES)评分、加州大学肩关节ULCA评分、VAS评分[分别为(91.78±6.42)分、(31.47±2.04)分、(1.25±0.83)分]均优于对照组[分别为(85.34±4.92)分、(
目的 探讨超声引导腹横肌筋膜神经阻滞复合全麻在腹腔镜手术中的应用效果.方法 将2019年2月至2020年10月本院收治的102例行腹腔镜手术治疗女性患者分为对照组(n=51)和实验组(n=51),对照组单纯实施全身麻醉,实验组则实施超声引导腹横肌筋膜神经阻滞复合全麻,对比两组血流动力学指标变化情况、镇痛效果及麻醉剂用量.结果 两组麻醉前(T1)、气管插管后(T2)等时段的平均脉动压(MAP)、心率(HR)水平比较差异无统计学意义(P>0.05),实验组切皮时(T3)、气腹建立后(T4)、术毕时(T5)等时
目的 深入探讨研究游离SPBRA皮瓣修复伴指掌侧固有动脉缺损手指创面的临床应用优劣性.方法 选取2018年1月至2020年12月本院收治的手指损伤伴指掌侧固有动脉缺损患者共62例.研究人员按照数字表法将62例患者分为两组:其中观察组31例,行游离SPBRA皮瓣修复治疗;对照组31例,行游离静脉皮瓣修复治疗.结果 两组患指切口均为Ⅰ期愈合,皮瓣均成活,观察组手术时间为(95.33±8.24)分钟,对照组手术时间为(76.06±6.17)分钟,观察组手术时间略长于对照组(t=8.0136,P<0.05).观察
目的 探究腹腔镜下胃大部切除术中应用镇痛指数(PTi)指导瑞芬太尼靶控输注的麻醉效果以及对应激反应的影响.方法 选取本院于2018年1月至2020年12月收治的行腹腔镜下胃大部切除术患者62例临床资料,按麻醉方式分为对照组和观察组,各31例.对照组采用持续静脉泵入瑞芬太尼维持麻醉,观察组根据PTi指导瑞芬太尼血浆浓度,维持PTi处于40-60范围,对比上述两种麻醉方式的安全差异性.结果 观察组瑞芬太尼使用量、苏醒时间、拔管时间、β-EP、AngⅡ和ACTH水平均低于对照组(P0.05).结论 PTi指导瑞