智能语音识别系统设计

来源 :E动时尚·科学工程技术 | 被引量 : 0次 | 上传用户：Hmilts

【摘要】

：

【作者】

：

杨帆　刘旭

【出处】

：

E动时尚·科学工程技术

【发表日期】

：

2019年15期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　摘要：基于LD3320芯片和STC10L08XE单片机，实现了简单的智能语音识别系统设计的要求。本文主要介绍了国内外智能语音识别技术的发展历史和近几年来各大互联网巨头对语音识别技术的布局，还有他们对语音识别市场的扩张，以及LD3320芯片的的使用。本文所选的设计方案属于离线语音识别，需要将识别指定提前输入到LD3320芯片内部，并绑定相应的操作。然后由麦克风收集语音信号，传送给LD3320处理，将匹配到的最佳结果反馈到STC10L08XE的主控MCU，MUC针对识别到的不同的语音指令执行相应的操作。同时，可以循环调用预存在寄存器里的语音片段，实现人机互动。此设计虽然满足了简单的智能语音识别的要求，但还存在一些无法识别的情况，背景降噪处理并不理想，无法识别较长的对话，仍然需要不断迭代。软件开发语音主要使用了C语言平台，C语言丰富的语音处理类库可以大大的簡化开发的难度，降低学习成本，也方便后期维护升级。而且C语言接近硬件底层，方便开发人员灵活的控制底层硬件。本设计综合利用了C语言和单片机的相关知识，进行了不同技术的整合，顺利实现了本次设计的功能要求，达到了可以稳定运行的预期。
　　关键词：智能语音识别;LD3320;STC10l08XE
　　1 前言
　　1.1课题背景及意义
　　随着计算机技术和人工智能的快速迭代，智能语音识别技术作为一种人机交互的新手段受到了人们越来越多的关注。国外的苹果、谷歌、亚马逊、微软、IBM国内的百度、腾讯、阿里、科大讯飞等公司也投入了越来越多的资源去开发智能语音识别技术。国内外媒体的大肆报道已经让智能语音识别技术走进入了大众视野，智能语音识别技术的市场正在高速扩张。基于上述现状，我选了智能语音识别系统的设计这个课题，方便我了解最新的技术发展趋势，学习智能语音识别技术的知识[1]。
　　1.2语音识别的应用场合
　　智能语音识别技术可应用的场景非常广阔，如声控开关，可用于操控智能设备的运行。语音助手，可用于提高我们的工作效率。智能陪护，可用于安抚我们的情绪。智能医疗，可以缓解医患关系，帮医生整理病人信息。语音输入，可以解放双手提高打字速度。总之，智能语音识别技术与不同行业不同领域的结合，会激发很大的想象空间，不断提高我们的生活水平，解放我们的生产力[2]。
　　智能语音识别技术需要的计算量比较大，对运行环境有较高要求。开发成本较高，学习成本高。在性能比较低的硬件平台下运行不理想，对多语种混合识别还有所欠缺，对噪音的干扰比较敏感。
　　2 系统设计方案
　　本设计是采用LD3320芯片与STC11L08XE单片机以及LED点阵屏幕共同组装设计的一款智能语音识别系统。整体设计方案由硬件电路设计和软件系统设计两部分组成。
　　系统设计必须完成以下功能：准确识别简单的语音指令;简单的语音交互;降低背景噪音对语音识别准确率的影响;多复用设计，在多种场景下可以自动匹配识别模式;低功耗，保证使用时间可达一周;系统遇到故障能自动重启，保证使用的稳定性;具有一定的纠错功能，自动识别录入错误并纠正;可嵌入多种产品中，保证不影响被嵌入的设备正常运行[3]。
　　2.1电源管理模块
　　STC10L08XE单片机是由宏晶科技有限公司出品一款基于8051系列单片机的新一代单片机，其指令代码不仅兼容老式的8051，而且其性能也有了巨大的提升，性能是老式8051的8-12倍。单片机内部集成了可复位电路，对高速通信，智能控制，和抗干扰能力做出了全面的优化。
　　2.2声光指示模块
　　使用单片机直接驱动蜂鸣器发出不同的声音完成声音提示。而且要保证声光指示模块即使出现故障，也不能影响系统的正常运行，模块耦合性低，不依赖其他系统，后期可进行升级更换。本模块选用的是LD3320芯片，该芯片是基于SI-ASR：Speaker-Independent Automatic Speech Recognition技术的声控芯片[4]。
　　3 系统软件设计
　　语音识别的操作顺序是：语音识别应用初始化，将识别词汇写入到候选列表，开始语音识别，设置好中断响应函数，开启中断允许位。如果不想使用中断函数的方式，需要在“开始语音识别”后，判断寄存器B2H中的值，如果寄存器中的值为21H就表示有识别结果产生，如果没有就返回无法识别。此后读取候选列表等操作与中断方式一样[5]。
　　通用初始化设置，按照自己的需求设置好各种寄存器。
　　语音识别初始化，检查通用初始化是否正常，如果正常，对语音识别初始化用到的寄存器进行设置。
　　写入识别列表，识别列表的设置规则是，每个识别条目对应一个1字节的编号ID，不同的识别条目的ID可以重复，不要求连续。本款芯片最多支持50条识别条目，每个识别条目是标准普通话的小写汉语拼音，每个字对应的拼音用一个空格间隔[6]。
　　4 系统调试
　　LD3320芯片测试通电后，通过调节（RSTB）管脚电平的高低，让其管脚29与管脚30都可以输出稳定的低电平，利用该芯片的这一特性来检测上电是否正常。
　　LD3320在通过上电调试后即可以进一步进行寄存器初始值的检测，在持续正常供电的情况下调用LD_reset（）函数，然后检查寄存器的初始值是否正常，重复调用LD_reset（）检查是否每次都能得到正确的初始值。如果系统稳定运行，每次的的初始值都会一样。如果检测出的值不稳定，说明系统的硬件电路连接存在问题，导致了LD3320不能正常工作。问题排除后即可得出稳定正确的初始值。注意，测试完成后要重置寄存器，避免写入的数据影响正常的程序运行。
　　对硬件和软件进行深度整合，排除软硬件之间的故障，使它们结合在一起，共同实现智能语音识别的功能。并实现了低功耗，可嵌入式，可长时间运行的语音识别系统的功能要求。
　　总结
　　本设计基于对LD3320芯片和STC10L08XE单片机的整合，成功实现的智能语音识别系统设计的课题要求。软件方面，使用标准的C语言进行编程工作，现有的很多开发者文档为本设计提供了很大的帮助，其中丰富的语音控制代码，为编程工作提供了非常大的方便。硬件方面，利用了LD3320芯片基于SI-ASR：Speaker-Independent Automatic Speech Recognition技术，且语音识别条目是可以动态修改的特性，以及芯片内部高度集成的AD和DA电路，配合STC10L08XE单片机实现了智能语音识别的功能。
　　本设计的结构相对简单，只能实现简单的人机对话，无法提供像智能手机基于大数据的智能语音识别能力，且识别的指令需要以字符串的形式预先输入到芯片内部，以匹配接受的的语音信号。
　　参考文献
　　[1]赵宏霞.基于语音识别技术的英语口语学习系统的设计与实现[D].首都经济贸易大学，2018.
　　[2]马文涛.一种面向NAO机器人的语音识别系统研究[D].重庆交通大学，2016.
　　[3]李婉玲.老人陪护机器人的语音交互技术研究[D].江南大学，2017.
　　[4]Kumar，N.，Van Segbroeck，M.，Audhkhasi，K.，Drotar，P.，Narayanan，S.S..Fusion of diverse denoising systems for robust automatic speech recognition[P].Acoustics，Speech and Signal Processing（ICASSP），2014 IEEE International Conference on，2014.
　　[5]邱全庆.面向机器人的言语交互系统设计[D].南昌航空大学，2018.
　　[6]张红艳.一种嵌入式短词语音识别系统的研究与设计[D].华东师范大学，2016.

其他文献

装载机工作装置动态载荷测试方法与试验研究

摘要：随着科技的不断进步，装载机铲装作业过程中的动态载荷时间历程是从工作工装置各铰接点处获得的，动平衡状态下作装置的受力模型是基于达朗贝尔原理建立，科学技术人员提出一种考虑构件重力和惯性力的动态载荷测试方法。通过对铰点力、油缸压力、油缸位移和动臂应变等多参数进行构建之后建立同步采集系统，最后实行散状物料铲装试验，从而在试验中获得了求解受力模型的基础数据。建立动臂有限元仿真分析模型可以通过分析模型

期刊

网络攻击与防范措施的研究与应用

摘要：随着计算机技术的不断发展，网络安全已经成为人们日益关注的焦点问题。网络中的安全漏洞无处不在，即便旧的安全漏洞补上了补丁，新的安全漏洞又将不断涌现.网络攻击是造成网络不安全的主要原因.单纯掌握攻击技术或者单纯掌握防御技术都不能适应网络安全技术的发展为了提高计算机网络的安全性，必须了解计算机网络的不安全因素和网络攻击的方法同时采取相应的防御措施。　　关键词：网络监听;木马;缓冲区溢出　　1 网

期刊

探索我国互联网金融的SWOT分析与对策

摘要：本文以我国互联网金融的SWOT分析与对策为探讨主题，结合近年来我国互联网金融的发展情况，分析互联网金融在云计算、移动支付、以及社交网絡上的发展优势，和其存在的风险控制能力不足、信用体系不完善、金融产品创新度不够等问题。提出相关的发展措施，以期促进互联网金融业的高效有序发展。　　关键词：互联网金融;SWOT分析;大数据与云计算　　前言　　随着科学技术与互联网的高效发展，以电子商务平台为核心的

期刊

浅析互联网整合营销的特点及其策略

摘要：互联网营销的方式有很多，为了在不同的时期、渠道发挥最有效的宣传效果，自然就会采用不同的方式来进行完成。互联网整合营销是时下比较流行的一种互联网推广方式，通过将信息的整合，能够达到更佳的宣传效果。本文从整合营销的起源开始，分析了互联网整合营销的特点及操作策略。　　关键词：互联网;整合营销;特点;操作策略　　一、整合营销的起源　　整合营销”理论产生和流行于20世纪90年代，是由美国西北大学市场

期刊

我国机器人的发展研究综述

摘要：随着工业4.0时代的到来，机器人产业迅速崛起。机器人在农业、工业和人类日常生活中的应用给我们的生活和生产方式带来了巨大的变化。人工智能引领着新一轮的技术创新和产业转型，是全球科技竞争的焦点，也是各国提升产业竞争力和国家竞争力的重要起点。　　关键词：机器人;发展;现状　　Abstract：With the advent of the industry 4.0 era，the robot in

期刊

做好油田企业退休职工工作的几点思考

摘要：各级领导和离退休管理人员要从思想上认识到退休职工工作，是我们党整个工作中的一个十分重要的组成部分，要切实从贯彻落实习近平新时代中国特色社会主义理论的思想高度，充分认识新形势下做好退休职工工作的重大意义，不断增强工作的责任感和使命感，特别是要认真研究和解决退休职工工作中遇到的新情况和新问题，扎扎实实地做好服务退休职工的各项工作。　　关键词：油田企业;退休职工;工作;思考　　一、社区对做好退休

期刊

智能避障灭火机器人控制系统设计

摘要：本设计主要就是针对消防机器人的制作与研究，机器人以AT89S52单片机为控制核心，加以电源电路、电机驱动、光电传感电路、火焰检测电路、灭火风扇以及其它电路构成。电源电路提供系统所需的工作电源，专用电机驱动芯片驱动电机控制机器人的前进后退以及转向，光电对管完成寻迹和避障，光敏电阻传感器检测火焰，灭火风扇进行灭火。该系统火焰探测采用自制的六路火焰传感器，其中是由五路远红外接收二极管和一路近红外

期刊

浅析我国CAM技术应用状况和发展趋势

摘要：CAM技术作为一门多学科综合性技术，近几十年来发展迅速，对制造业产生了深远的影响。本文较介绍了CAM技术在我国的应用状况，对比国外先进国家CAM技术的应用现状、技术特点和发展趋势。　　关键词：CAM;应用;现状;趋势;分析　　CAM技术，即计算机辅助制造技术，是指借助计算机来完成从生产准备到产品制造出来的过程中的各项活动，如计算机辅助数控加工编程、制造过程控制、质量检测与分析等。CAM是C

期刊

中原油田标准化管理系统应用性分析

摘要：油田的标准化管理是以建立健全企业标准体系为基础，以管好、用好这一标准体系为手段，最大限度地满足油田生产和经营管理对标准化的需求。为实现“简化、协调、统一、高效”的标准化管理，它有五个模块，征求意见、实施问题、复审意见反馈、标准体系和标准查询，实现中原油田的标准化信息化远程管理。　　关键词：标准化;管理系统;应用性;效益　　一、标准资源的共享　　截止2017年，中原油田共有企业一级标准240

期刊

天然气脱硫装置的主要能耗分析及节能策略研究

摘要：现阶段，为了使我国的经济绿色、可持续的健康发展提升能源的利用率非常重要。脱硫处理是净化天然气工艺中的关键点，本文通过对净化工艺中脱硫装置的能耗问题进行了分析，提出了几点节能措施以供参考。　　关键词：天然气;脱硫处理;节能措施　　1 引言　　天然气作为一种清洁能源在人们的日常生活中不可或缺，同时天然气的使用既符合了节能减排的要求还推动了低碳经济的发展。因此加快天然气产业的快速发展尤为重要。但

期刊

智能语音识别系统设计

与本文相关的学术论文