【摘 要】
:
随着社会生产力提高和科技快速发展,人类越来越重视人机交流互动的技术。除了键盘-显示器的人机交互方式之外,语音互动技术以其快捷便利深受人们喜爱。然而在实际人机语音交
论文部分内容阅读
随着社会生产力提高和科技快速发展,人类越来越重视人机交流互动的技术。除了键盘-显示器的人机交互方式之外,语音互动技术以其快捷便利深受人们喜爱。然而在实际人机语音交互过程中,由于说话人所处环境背景噪声的不确定性,人机对话的语音识别存在着诸多不稳定因素。例如:在噪声环境下的语音识别,既要分析说话人对话内容,又要解决因所处环境噪声干扰导致的说话人声音掩蔽效应等问题,同时还要满足实时性、可靠性等各项需求,多重因素叠加,常导致复杂空间环境中声学识别的有效应用受限。目前,关于复杂空间噪声环境下对说话人的稳健语音识别技术优化问题,已经受到相关学者的广泛关注。为解决复杂空间噪声环境下的语音识别,本文提出了一种稳健语音识别技术的优化方案。方案结合复杂空间的应用环境特点,特别针对项目中的室内环境特点,应用长空间理论复合声源判定方法建立了噪声模型,并结合场景布置情况,采用优化补偿算法提高了其对特性场景的适应性;在应用场景的语音信号识别部分,声纹识别的前级采取多通道采样的方式来确定说话人数目;方案改善了识别系统对于说话人数目进行平滑判决决策的识别能力,同时新增的自适应特性提高了其环境适应性。方案还结合噪声特性以及采样设备布置场景特性等因素,对适配噪声应用场景使用支持向量机的方法进行了模型匹配及训练,有效提高了现场语音识别成功率。整个识别系统方案已在小规模实验室测试,并在嵌入式主机平台组成的智能家居室内工作环境实现了语音识别与声纹验证。该实施案例已部分应用于项目,有效改善了原终端用户的交互体验。课题的研究和实践,为复杂空间噪声环境下的稳健语音识别技术优化提供了有效的解决方案,并对今后的基于嵌入式平台设计在不同噪声场景的鲁棒性提供了宝贵的经验积累。
其他文献
叠合板式剪力墙在建筑领域运用日趋广泛,但人们外对于新型的单面叠合板式剪力墙的抗震能力认识依旧不多。为使该结构更好的推广和使用,同时作为高层结构的建设依据,本文对一
干散货占全世界船队总运力的40%,散货船在世界海运中占据重要地位。然而,散货船因舷侧结构相对单薄,曾发生了许多的海损事故,造成了重大的人员与财产损失。因此,开展舷侧板架
随着工业4.0的发展,在现代能源、制造业、重工业等自动化系统控制领域中,大规模分布控制系统需要具备随生产需求变化自动切换各子系统输出的能力。对此,目前合作分布式预测控
人力资源是社会各种资源中最重要的资源,对于企业的发展而言,科学有序的人力资源管理有利于巩固和提升企业的核心竞争力,使企业能够获得长远发展。那么如何使人力资源发挥出
传统钢筋混凝土结构由于混凝土材料的固有缺陷,暴露出耐久性低、韧性低、变形能力差等工程难题。为解决这些问题,研究人员通过材料复合化的途径,研制出了工程水泥基复合材料E
互联网上信息过载给人们获取需求信息带来困难,摘要的出现使得人们能够快速准确地了解文档的主要内容,而人工摘要成本较高,并且具有很强的主观性,难以解决信息过载给人们带来
制造业是国家经济发展的基础产业,随着世界各制造大国纷纷重视制造业,相继提出各自国家的制造业发展规划,我国也相应出台《中国制造2025》以实现制造强国的战略目标,而其中的
心脏血管疾病和脑血管疾病统称心脑血管疾病(Cardiovascular disease),包括高血压、冠状动脉粥样硬化性心脏病(简称冠心病)、高血脂、脑出血、脑梗死、心绞痛和心肌梗塞等。随着
针对基于词向量的神经网络模型在产品属性情感分析中效果不佳的问题,提出一种集成离散特征和词向量特征的深度集成神经网络模型。该模型首先引入和直接循环图紧密结合的特殊
随着我国经济的快速发展,国家电力体制改革的不断进行,发电企业将会面临着巨大的竞争压力。要在电力市场中处于优势地位,发电企业要在利润最大化的基础上,提高生产效率,降低