家电命令词意图理解技术研究

来源 :庄叙毅 | 被引量 : 0次 | 上传用户:huandakedi222
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是当今人机交互的重要手段之一,它在音频转录、语音通话、命令词识别等方面有着广泛的应用。家电命令词识别正随着万物互联的新风走进千家万户,但是死板的固定格式的智能家电命令词严重影响了用户的使用体验。因此,更贴近生活的家电命令词意图理解的技术研究有非常大的实用意义。本文对家电命令词意图理解技术进行深入的研究,提出了语音识别和意图识别两个模块化模型结合的方法:在语音识别模块方面,研究设计开发了基于Mo Ch ALDT的端到端语音识别模型,在VAD后采用梅尔滤波器组输出及其差分系数特征作为识别系统的输入特征,利用四层的轻量化的VGG网络对特征进行了提取和压缩。研究在统计了超过1300小时语料库音频能量分布后,经过时长权重加权计算,提出了能量补偿的方法,将音频能量分布标准化后能够更有效的提高语音识别模型的鲁棒性。论文详细分析了Mo Ch ALDT的端到端语音识别模型构建方法,其中为了减少注意力机制的计算量并提高计算速度,研究设计了轻量化动态卷积门替代Transformer基线模型中自注意力机制,利用动态通道共享卷积的方式实现多头注意力效果。同时使用了基于单调块注意力机制的编—解码器替代了基线模型的编—解码器,将计算复杂度从O(~2)降低至O(max(,)),在有效提高模型计算效率的同时还提高了模型的可解释性。研究对基线模型同Mo Ch ALDT的效果进行了对比,实验证明Mo Ch ALDT在训练时的收敛速度,测试时的识别准确率都有明显的提升。为了配合意图识别模块,研究还对不同类型token对语音识别模型效果的影响进行了研究,最终分析确定使用中文注音作为输出token的类型。在意图识别模块方面,研究分析了目前家电命令词识别模型,设计开发了基于双向门控制单元网络的三头注意力网络。使用共享的双向门控制单元网络提取语音识别模型输出token中潜在的信息,利用三头注意力机制对语用环境下家电命令词意图的三个部分进行识别。本文详细介绍了意图识别模型所采用的对抗训练和多任务学习的训练方法,有效的提高了意图模型的稳定性。为了使模型能够在实现语用环境中使用,研究收集,整理,构建了开源数据集固定格式家电命令词语料库,私有数据集固定格式家电命令词语料库并设计开发了日常语用环境家电命令词语料库。根据置信度算法确定意图识别输出置信度阈值,在保证高效识别的同时有效的降低了模型错误率和错误成本。经实验测试验证,模块化的家电命令词意图理解系统的研究实现了固定格式家电命令词92%的识别率,在日常语用环境家电命令词85%的识别率的效果。
其他文献
随着大众旅游时代的到来,旅游产业已成为发展国民经济的重点之一。山地旅游资源作为分布最为广泛、品种丰富、资源体量大的一类旅游资源,利用山地旅游资源发展旅游产业的有效途径之一。山地中赋存有大量地学旅游资源,可以发展地学旅游。地学旅游是具有特殊的旅游吸引力和科普研学价值的新兴旅游形式,在将来的旅游市场中扮演重要角色,对地学旅游的研究和开发也成为推动旅游产业发展必不可少的环节。苍山作为世界地质公园是山地旅
学位
水声通信系统离不开前导信号检测,因为前导信号检测过程是通信系统的唤醒机制的关键,但是水声信道中的各类干扰、大时延和多普勒拓展则对前导信号检测提出了很多挑战。目前水声通信系统中,前导信号检测方法有很多种,如基于匹配滤波的检测方法、基于稀疏信道识别的检测方法等,其中基于匹配滤波的方法得到实际应用。但是这些方法均存在着一定缺点,尤其是在低信噪比下检测性能欠佳。而且为了保证水声通信系统下前导信号能被正确检
学位
数学对人类社会的发展至关重要。在高中阶段,数学学科高度的抽象性、结论的确定性和应用的广泛性等特点,使得很多学生觉得高中数学难度太大,学起来非常吃力。再加上学生本身学习方法不当,学校老师和家庭的诸多因素,使得在高中教育阶段出现了越来越多的数学学困生。数学学习困难严重影响了学生自身的发展,同时也给一线数学老师的教学工作带来严重阻碍,为了帮助学生更好的学习,本文以信阳市第一高级中学高二文科部分学生为例,
学位
近年来,以脑机接口为代表的人机交互领域取得了飞速发展,是人工智能技术和神经科学的重要组成部分。具有良好情感交互能力的机器可以根据受试者的脑电信号做出正确的反应。实现脑电信号的情感状态识别,深入挖掘脑电信号中所含的情感信息有助于增强机器智能,具备重要的科学研究价值和实际应用前景。现有方法主要利用卷积神经网络和频域图卷积神经网络方法进行脑电信号情感状态识别。基于卷积神经网络的情感分类方法需要预先确定脑
学位
传统控制器由于存在通用性差、编程语言不统一等不足以及随着智慧工厂的建设,企业迫切需要一款物联网型的开放式控制器,从而基于PLCopen标准开发出一款开放式的物联网型控制器。该控制器以STM32F407为处理核心,集成了PLC逻辑控制、PLCopen标准的运动控制以及物联网的功能。针对控制系统对独立性、稳定性以及实时性的要求,以嵌入式实时操作系统(RTOS)为系统平台,以模块化和多任务的思想为设计指
学位
集成电路(IC)已经广泛的应用到社会生活的多个方面,然而随着集成电路的产业全球化,芯片也将面临来自硬件木马(HTH)等多方面的威胁。如果芯片被成功植入HTH,敌对方可以在特定时间启动木马,从而实现对于芯片功能的破坏或者机密数据的获取,这毫无疑问将对军事系统、金融系统、交通安全、智能家居等领域造成极大的安全威胁。由于在设计时间插入的木马比制造阶段插入的木马检测难度更高,敌对者可通过修改目标IC的硬件
学位
金融是当代经济的重要组成部分,在世界经济的大环境下,在我国政府的领导下,以中国人民银行为核心的金融机构体系下,我国金融市场对内不断增强实力、夯实基础,对外不断发展,使我国金融总量不断地提升,大幅增长。《中国金融稳定报告2021》指出,中国坚持高质量发展方向不动摇,统筹疫情防控和经济社会发展,“十三五”规划圆满收官,脱贫攻坚战取得全面胜利,全面建成小康社会。2022年3月在第十三届全国人民代表大会第
学位
面对大规模分布式移动用户设备的海量数据处理需求,传统云计算系统面临着网络传输能力不足、算力不足、隐私泄露、安全风险等一系列问题。为了解决上述问题,研究者提出了一种新的计算模式——联邦学习,其核心思想是将计算下沉到终端用户设备上,有效地避免隐私泄露风险。为了解决实际部署问题,研究者提出了一种基于边缘计算的多层联邦学习架构,其核心思想是通过在网络边缘端部署边缘计算服务器.由于大部分模型参数的传递和聚合
学位
光学相控阵是一种通过调节相邻单元之间的相位差实现光束扫描功能的技术。光学相控阵的理论基础来源于微波相控阵,但是相比于微波相控阵,光学相控阵以激光作为光源,不容易受到传统的无线电波的干扰;而且激光的光束窄、不易被探测、具有良好的保密性。目前,光学相控阵由于其质量轻、体积小、功耗低、并且可以集成在一个芯片上,在激光雷达、光检测和测距、光学成像、及自由空间光通信等领域有着广泛的应用。近年来,随着硅光子学
学位
卫星物联网(Satellite Internet of Things,S-Io T)通过将卫星与地面物联网集成在一起,能够利用卫星的广域覆盖特性随时随地实现大规模机器类型通信(massive Machine Type Communication,m MTC),促进了对基于位置的服务、智能农业、远程医疗、环境监测、地质灾害预测等广域覆盖应用。但是,相比地面基站而言,卫星的功率和存储资源受限,星地信道
学位