基于深度学习的语音关键词检测技术研究

来源 :华南农业大学 | 被引量 : 0次 | 上传用户:sidney1221
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动语音识别是机器自动识别语音转换成文本的一项技术。语音识别技术在人机交互中具有广泛的应用,而语音关键词检测是语音识别一种特殊方式。随着语音数据的增加,语音关键词搜索变得越来越重要。语音关键词检测的任务是确定给定的词或者短语是否出现在语音片段中,以及出现的位置。典型的语音关键词检测系统主要是自动语音识别和信息检索两部分。随着最近几年语音识别技术的发展,深度神经网络已经成功应用在语音识别领域。本论文中主要研究了基于深度神经网络的语音关键词检测技术。本文首先介绍两部分系统框架,分为语音识别和关键词搜索。语音识别框架包括信号特征处理和解码引擎。解码引擎包括训练阶段的声学模型、发音字典和语言模型。在关键词检测阶段使用基于网格的形式,构造索引,根据置信度得分来确认关键词。本文首先利用开源kaldi工具箱和F4DE工具包在数据集Thchs30上构建了汉语关键词检测系统。对比了不同激活函数的DNN-HMM模型和传统GMM-HMM模型系统下的性能,深度神经网络模型的语音识别器要优于传统的语音识别模型从而给关键词检测搜索的性能提高了大约6.5%。基本的KWS系统都是基于词格计算后验得分,并使用它们来做出“yes/no”的决策。基于词格的后验概率主要问题可能会出现假定的检测具有低的后验得分,使得检测器不能检测到它而将其视为漏检。从而,本文的目标是通过检测和提高漏检的分数来增强关键词决策。本文研究了DNN-HMM模型与GMM-HMM模型融合进一步提升ASR的性能。针对识别器的漏检问题,本文研究使用一种两阶段重新决策的方法。本文在融合ASR的基础上得到第一次关键词检测的候选列表,然后依据多模板匹配的方法计算检测关键词决策和没有决策之间的相似得分,并将相似得分转化为没有决策列表中的新后验概率得分,最后进行重新分数归一化用于新的阈值决策。本文利用kaldi工具和F4DE工具包在数据集AISEHLL1上构建了关键词检测系统。通过实验对比了在融合模型与单个模型的语音识别器性能和通过模板匹配得分与不使用模板匹配得分在关键词检测上的性能,融合模型的WER比单个模型的要低和ATWV比单个模型要高。实验证明融合模型下的模板匹配相似性得分能够有效地提升语音关键词检测系统的性能。
其他文献
【解题策略】1.标名代一般完整的句子都有主谓宾。在文言断句时,先标出语段中的名词和代词。因为同现代汉语语法一样,古文中的主语、宾语一般由名词或代词充当,断句时可先找出名词,如:人名、地名、官名、国名、朝代名、器物名、动物名等;也可先找出代词,如吾、予、余(表示"我"),尔、汝(女)、公、卿、君、若(表示"你"),其、彼、此、之(表示"他")等。这些名词或代词如果作主语,那么它的前面就可能要断句;如
期刊
水稻是我国重要的粮食作物之一,在水稻生产中,准确检测水稻的位置是田间精准管理的前提。旱田中采用机器视觉技术对作物位置检测的应用较为广泛,然而,由于水田种植环境的图像背景复杂,使得应用机器视觉的方法检测秧苗位置存在较多技术困难。此外,高质量图像采集和处理系统价格昂贵,体积大且便携性较差,致使在农业生产上实现全面推广普及存在难度。因此,本文开展了新型水田作物位置检测系统的研究,为精准田间管理作业提供重
深松技术是实现保护性耕作的有效措施,长期的铧式犁翻转作业和旋耕刀旋耕作业在土壤耕层以下行成了坚硬的犁底层。深松作业的目的就是打碎土壤犁底层,调节土壤的三相比和蓄水保墒能力,减少风蚀水蚀,增强农业的可持续综合性发展,为我国农业可持续发展提供保障。目前深松机具的推广主要存在牵引阻力大、能耗高等关键因素的制约。在深松减阻研究领域中,当前使用较广的方法是振动深松减阻技术,其中受迫式振动是本文的研究机理,本
近年来抗生素在人体治疗方面大量使用,自然条件下其在水环境中难降解的特点给生态环境造成了巨大的威胁。光催化技术作为一种去除水环境中污染物的有效方法,目前已在污染物的降解方面得到广泛应用。在光催化降解抗生素过程中,光源对其降解效率至关重要,与传统的高压汞灯及紫外荧光灯等催化光源相比,紫外LED具有更高的能源利用率。考察了紫外LED阵列和高压汞灯的光谱特性及光场分布,比较结果表明,全波段内紫外LED光源
烟叶是中国重要的经济作物,烟叶的生产过程中的涉及环节较多,生产流程也比较复杂。而且由于烟叶的种植较多为小范围种植经营,其栽培具有经验性、分散性等特征,生产管理水平比较低下。生产管理中存在着生产者缺乏先进的栽培技术和信息知识,导致了管理手段落后、栽培规范性不足等状况。因此,利用信息技术为种植者提供专业的信息服务是解决这一问题的重要途径。本论文的研究是基于烟叶生产管理的信息化研究,旨在利用先进的计算机
棉花是我国重要的经济作物,在国民经济中占有十分重要的地位。在棉花的生长过程之中会遭受到多种病虫的危害,其中蚜虫和红蜘蛛都是棉花的主要害虫,如果不及时防治会严重影响棉花的产量和质量。传统的防治方法是喷洒农药,但过度的喷洒农药会污染环境。现在提倡精准喷施,精准喷施的关键一步是识别虫害,光谱分析技术能利用物体之间反射率的差异性来区分物体,而且快速、准确、无损伤。结合光谱分析技术和机器学习算法,本文对棉花
农业文化遗产研究在我国已有一段历史,其研究范围从农史资料的收集整理逐渐扩展到农业生物多样性保护、农业文化保护、农业遗产旅游发展、社区参与机制建设等方面,概念的内涵和外延不断扩展。农业文化遗产保护与利用是一个新兴的研究领域,近年的中央一号文件也提出了“重视农业文化遗产保护”。柚起源于中国,是柑橘类中一类重要的果品,在全球热带亚热带地区有着广泛的栽植。国内栽植面积最多的首推沙田柚及其品系,占柚类总栽植
果树修剪工作是果树管理过程中必不可少的环节,对促进果树生长和提升果实品质具有重要作用。随着果园电动修枝剪的不断推广应用,刀具易磨损、崩刃等情况影响工人作业效率,降低电动修枝剪刀具使用寿命,引起使用成本上升,严重制约果园机械化发展。因此,对电动修枝剪刀具减阻耐磨研究具有重大意义。本文选用基于赤子爱胜蚯蚓头部舒张态形貌进行仿生微织构设计,采用激光刻蚀在SK-5材质刀具表面主要摩擦磨损区域成型仿生微织构
中国提出“一带一路”,在这个倡议下,中国深化了与世界其他国家的合作,尤其是农业方面的合作。各国为了提高本国农业的国际竞争力,都对本国农产品质量进行严格控制与管理。在中国,为了更好地践行“一带一路”的“走出去”策略,打破国际农业“绿色贸易壁垒”,企业为提高农产品质量与绩效,大多都采用了“公司+农户”的合作模式,这种模式也称为订单农业。在这种模式下,农户专门负责农业生产,公司负责对农户生产出来的农产品
木薯不仅是优质淀粉产品的原料,也是乙醇的原料作物,木薯在众多领域里利用率高。为了保障国家能源战略安全,发展木薯为原料的生物质能源成为本国政府战略储备之一。广西农户种植木薯的历史悠久,木薯种植面积和产量均位于我国第一,广西拥有专业的木薯栽培技术及品种研究机构,以及众多的木薯深加工企业,广西发展木薯产业化具有广阔的前景。然而广西木薯在大量进口东盟国家优质低廉的木薯原料的冲击下种植面积下降。梧州木薯产量