基于机器学习的工业语音指令识别研究及设计

来源 :贵州大学 | 被引量 : 0次 | 上传用户:Sunmin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
工业是我国国民经济的主导产业,制造业是工业的重要组成部分,我国在“十四五”规划和2035年远景目标纲要中,强调了制造业对进一步壮大实体经济具有极其重要的作用,应推动制造业高质量发展。工厂是从事各种工业生产活动的主要场所,生产作业中产生的噪声及作业人员表达的方言与普通话的差异,都有可能造成口头指令交互出错,进而增加事故发生的风险。目前,作业人员只能依靠人工记录、或全程录音的方式对口头指令进行记录,但两种方式都不能很好的解决上述问题。因此,将语音降噪技术与语音识别技术应用到工业环境中,实现工业噪声环境下的方言语音指令识别,是一次重要探索与尝试。本文依托人工智能和机器学习技术,以贵阳方言为例,实现工业噪声下带噪语音的预处理,搭建方言语音指令识别系统,有效识别工业噪声下的语音指令,将识别结果以文本形式显示,方便作业人员查看,提高口头指令交互的准确性,同时将文本存储,用于事故发生后的责任认定。主要研究工作如下:(1)针对工业环境下的强噪声干扰问题,提出了改进谱减法和基于改进谱减法和能零比端点检测算法的联合优化算法。首先,通过实际应用语音降噪算法中的谱减法,发现谱减法对脉冲噪声的滤除效果几乎为0,针对这一缺陷,将带噪语音自身能量融入谱减法公式计算中,提出了改进谱减法,该改进可以对带有脉冲噪声的语音实现更好的噪声滤除效果且不影响其他种类噪声的滤除;其次,分析了双门限端点检测算法和能零比端点检测算法并总结出其局限性,得出结论:随着信噪比的不断降低,单纯依靠端点检测算法无法准确的划分语音段和纯噪声段,必须先进行语音降噪再进行端点检测;最后,提出一种基于改进谱减法和能零比端点检测算法的联合优化算法,试验结果表明,该联合优化算法可以实现更好的端点检测效果。(2)针对贵阳话与普通话的差异,及方言对识别系统识别准确率的影响,汇总出贵阳方言音素集和发音字典,收集了一定时长的贵阳方言语音数据并进行了抄本标注。首先,分析了贵阳方言与普通话发音上的区别,根据普通话音素集和发音字典汇总出贵阳方言音素集和发音字典,音素集包含贵阳方言发音所有的声母和韵母,发音字典用于将语句从字细分为音素;其次,收集了一定时长的语音数据并进行了抄本标注,用于后续的模型训练与验证测试。(3)基于Kaldi语音识别工具,设计实现贵阳方言工厂指令识别系统。首先,搭建GMM-HMM(Gaussian Mixture Model-Hidden Markov Model,GMM-HMM)声学模型和DNN-HMM(Deep Neural Network-Hidden Markov Model,DNN-HMM)声学模型,通过模型测试证明DNN-HMM声学模型具有更好的性能;其次,基于DNN-HMM模型搭建离线语音识别系统,实现提前录制好的语音音频识别和直接通过麦克风输入语音识别两种识别方式;最后,完成相应的软硬件设计及测试,通过实际应用,证明该识别系统的有效性与可行性,基本可以满足工业环境下的方言语音指令识别任务。
其他文献
我国的人口基数大且伴随着早年间计划生育的政策,目前各年龄阶段的人口分布不均匀,整体年龄结构呈现出橄榄型特征。尽管现在放开了二孩政策,但是受到生活成本不断提高和优生优育观念的影响,女性的生育率并没有大幅度提高,并且这种预期是持续的,所以未来生育率并不可能大幅度提高。这也就预示着当我国进入老年社会时,一方面将会出现老年人人口基数大,且劳动力人口供应不足的局面;另一方面,随着医疗技术的不断进步,人均寿命
学位
为了实现“碳达峰、碳中和”的宏伟目标,近年来地基处理中愈发强调对周边环境的保护,同时兼顾经济性和适用性,因此就地取材,因地制宜显得更为重要。土工织物封装火山渣桩是一种新型软土地基处治技术,火山渣填料不但具有类似于传统碎石填料的力学性能,而且火山渣作为环境友好型材料,在部分地区取材更方便,造价更低廉,目前对土工材料封装碎石桩已有大量研究,但对土工织物封装火山渣桩的研究还鲜有耳闻,其承载特性机理及受力
学位
在新时代背景下,乡村社区共同体建设是实施乡村振兴的重要路径,也是实现人民幸福生活的关键步骤。以往研究聚焦从文化、地域、伦理、情感和利益等单一层面阐释乡村社区共同体建设,难以为当前乡村社会所面临的人口老龄化、乡村空心化、个体价值观念差异化等现实困境寻找出路。因此,应从生活视角来研究乡村社区共同体建设问题:在价值理念上,乡村社区共同体并非单一分散的共同体叙事,而是一个涵盖主体性的人、并以生活为目的的乡
期刊
车—桥耦合动力系统中,由于作为激励源的轨道不平顺具有随机性,因此,车—桥耦合系统的响应也具有随机性。并且,由于车辆在桥梁上的位置时刻改变,因此,车—桥耦合动力系统又是时变系统。由于轮轨接触非线性,阻尼非线性,桥梁非线性等各种因素,致使车—桥耦合动力系统为非线性系统。因此,对于这样复杂的系统,如何高效地研究其随机响应分布,一直是本领域的难题。在以往研究中,学者们更多的是使用随机振动理论来进行计算,但
学位
膀胱癌根治术前新辅助化疗虽带来了生存获益,但其疗效有限且不良反应较大。新辅助免疫治疗包括免疫单药治疗及免疫联合治疗,其在病理完全缓解率、病理降期率方面的优势明显。本文综述了膀胱癌的新辅助免疫治疗相关研究并讨论潜在的疗效预测生物标志物。
知识经济时代,市场竞争逐渐转变为人才的竞争,企业对人才的开发与利用更加重视。F公司作为一家航空制造类的国有企业,一直积极在员工中宣导敬业的概念,希望通过员工敬业度的提升增强企业内部的凝聚力,从而提升企业经营的效率。本文以F公司为研究对象,以调査问卷的方式,通过数理分析、文献研究、访谈等方法收集到的第一手数据资料,运用规范分析与实证分析相结合的方式来研究F公司的员工敬业度水平和驱动因素,并针对性地找
学位
近年来,随着我国步入老龄化社会,脑卒中患者的数量越来越多,增加了社会的运行负担,因此有必要研究如何帮助卒中患者更好地进行康复训练。目前,对于脑卒中患者的康复训练仍然以传统方式为主,不仅康复过程枯燥无聊,而且缺乏患者的主动参与,康复效果往往不佳。脑机接口作为一种新兴的人机交互方式,应用于康复训练领域时,能够激活患者大脑运动感觉区域的神经元细胞,有助于患者中枢神经的重塑,从而提升患者康复训练的效果。因
学位
进入新世纪以来,我国涌现出昆明火车南站、广州新电视塔以及香港青马大桥等一系列大型工程,在这些工程中,钢筋混凝土(Reinforced Concrete,简称RC)结构占比超过90%。由于环境因素作用、建筑材料老化、动荷载疲劳、密集人群荷载、自然灾害影响等原因,不可避免的导致混凝土结构的损伤积累与抗力衰减,严重时甚至可能引起结构突然破坏。应用RC结构的损伤识别方法,可以及时确定结构损伤发生的具体位置
学位
在推进我国改革开放的过程中,我国科技进步水平有了很大提高,电力能源的应用效果和应用水平也有了很大提高。毫无疑问,电力能源在生活中扮演着重要的角色,绝大多数家用电器主要以电力能源利用为突破口,积极便利了人们的衣食住行和实践活动。另外,结合相关实践活动和基础理论分析可以看出,与电有关的物理现象主要表现在日常生活中,对各种物理现象的有效利用,不仅可以使电的顺利运行创造良好的环境,也可以提高每个人的生活水
期刊
A公司是一家制造加工企业,近几年来取得了持续的快速发展,但是随着企业的逐年壮大,快速成长过程中面临着许多问题,企业内部的管理不足也逐渐暴露出来,现有的管理方法和生产方式很难满足企业未来的发展需求。PVC管路车间结合市场需求特点和生产现状,决定由现有的大批量库存式生产方式,全面向多规格、小批量生产方式转化,在此转化过程中运用工业工程的管理理论,对车间现场生产方式进行改善。本论文主要以PVC管路车间为
学位