语音身份与内容同时识别技术及其应用研究

被引量 : 0次 | 上传用户:liu716313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术的广泛应用,语音识别技术逐渐成为当前研究热点之一。语音是人机交互中最自然的一种方式,而语音识别技术是人机语音交互的关键所在。对于特定的应用场合,需要同时识别语音身份与内容,并要求识别算法适合于嵌入式系统,如车载系统、智能家居等。本文主要研究了语音身份与内容同时识别技术,并将其应用于智能家居环境下的语音控制系统中。本文主要工作内容包括:(1)研究了语音信号的端点检测与特征提取技术,用于完成语音信号的预处理。探究了几种常见的语音自适应方法,并深入研究了Herbig等人于2011年提出的语音身份与内容同时识别机制,用于实现语音身份与内容同时识别。(2)结合集成学习与语音识别,实现了基于Bagging与GMM的语音内容识别方法,从而提高了语音内容识别率与识别率稳定性。针对资源有限的嵌入式系统,基于SQ(Soft Quantization)集成多个语音内容识别模型,有效的降低了识别模型的空间复杂度,使得语音内容识别系统更适用于嵌入式环境。与利用传统的投票选择集成方法相比,该方法在集成模型数量较少的情况下,还能够提高语音识别系统的识别率与稳定性。为了实现说话者群与语音内容同时识别,利用SQ集成说话者群模型与语音内容识别模型,实时计算每一帧语音信号的最优解码器,同时对SQ得分最高的模型投票。通过模型的得票率比较完成说话者群识别,同时利用最优解码器完成语音内容识别。实验中,当语音内容识别模型的集成数达到6个时,语音内容平均识别率为88%,说话者群平均识别率为81.56%。实验结果证实了特定应用场合下说话者群与语音内容同时识别的可行性。(3)本文利用说话者群与语音内容同时识别算法,实现了智能家居环境下的语音身份与内容同时识别系统。实验中,当语音内容识别模型的集成数达到5个时,语音内容识别率达到了96.64%,说话者群识别率为88.24%。实验结果表明该方法适用于智能家居环境下的语音身份与内容同时识别。
其他文献
<正>商业街在现实社会中往往被人们寄予较高的期望,美其名日“金街”,期望给城市和商家带来更多的经济利益。许多的大中城市认识到商业街的群体效应带来的巨大利益,正在传承
<正> 随着我国政治、经济形势的好转和对外开放政策的进一步实行,来我国参观、访问和旅游的外宾日益增多。对于这部分人的商品销售服务工作,已经成为我们商业工作的重要组成
期刊
针对喷气织机供气系统能耗高及辅助喷嘴气耗大的问题,介绍了喷气织机的一些节能降耗措施。阐析了辅助喷嘴气耗大的主要影响因素,认为要降低辅助喷嘴气耗,需将辅助喷嘴引纬工
由文筑国际主办的大师之旅建筑系列讲演会第四回:光与重力"于2007年9月8、9日分别在上海和北京举行。本次活动成为上海市建筑学会全年最主要的学术交流活动之一,是全面深入介
Sonic Hedgehog(Shh)、Gli1蛋白和血管内皮生长因子表达在大肠癌的发生发展过程中的作用还不清楚.通过免疫组化法检测78例大肠癌及30例正常组织中Shh、Gli1和VEGF的表达,并与
<正> 1.领域和应用范围本国际标准中规定的方法是测定: a)总腐植酸含量即与煤中矿物质结合为腐植酸盐的腐植酸和游离腐植酸; b)游离腐植酸褐煤和柴煤的腐植酸含量随煤的类型
探索应用外源性抗植物病毒蛋白进行植物病毒病的防治,已经取得了一定的成效;但不同来源的抗植物病毒蛋白,它们的作用机理是不完全一样的.根据近年的研究结果,对这类蛋白的抗
朝鲜朝盛行一时,流行至今的韩国九曲图,与九曲歌系诗歌和九曲园林,正是韩国九曲文化之三大构件。九曲图就是以"九曲"为素材绘制而成的图画,其表现形式可分为有助于阐释"道"理
作为化石能源的替代品,以微藻能源为核心的生物能源受到越来越多的关注。作为单细胞生物,微藻有生长周期短、易培养、光合效率高及含油量高等优点,在各类生物能源中具有理想
泰国中小学汉语课堂教学秩序差,学生课堂问题行为频发已成为广大志愿者教师的共识。这对教师的教学和学生的学习都产生了一定的消极影响。本文在借鉴国内外相关研究成果的基