论基于机器人的语音识别技术

来源 :电脑迷 | 被引量 : 0次 | 上传用户:thangna9806
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要 语音识别技术是一个涉及多种学科的集成技术,目前已在工业、军事和医疗部门,产品检验和人机语音通信等领域取得了广泛的实际应用。语音识别技术长期以来一直是研究热点,但现有的语音识别系统运行缓慢,成本高,不方便使用。这些缺点影响了语音识别的速度,系统的硬件实现和应用。特别是在吵闹的环境中应用智能机器人语音识别更是非常困难。用于识别的工业智能机器人技术研究也越来越受到人们的关注。
  关键词 机器人 语音识别 声学模型 语音特征参数
  中图分类号:TP242 文献标识码:A
  1语音识别技术的研究意义
  人们使用的声音语言是一种人在特定高度思维和意识活动下的产品。语言是人类最直接以及最理想的交流方式,也是人机通信是最方便的方式。在机器人发展的高级发展阶段中,机器人的智能语音识别与人类的活动是密切相关的,有声语言的人机交互信息成为重要的手段。例如,语音识别获取外界信息很自然,没有特殊的训练方法,随着机器人技术的发展和广泛应用,有越来越多的机会来接触人类和机器人,所以人们希望通过语音识别和机器人去处理,不管谁能能准确安全,方便地操纵机器人。机器人和人类之间的信息交互,表现在两个方面,一是对更高层次的机器人操作,方便软件的设计开发,这种多为教学机器人,另一种是在实际操作的要求下完成信息交互任务的机器人。智能机器人作为机器人技术发展的高级阶段,其发展趋势是:不仅要求机器人具有高度的自治能力,还要使机器人和人类之间的协调也具有一定的智能性。这就要求机器人具有不同的高性能主动做事能力,而不是被动地接受任务,为了实现这一目标,自然语言作为人机信息交换将发挥越来越重要的作用。目前,智能机器人已成为机器人研究领域的一个热点。工业机器人是智能机器人的一个重要研究领域。当今,工业机器人的发展方兴未艾,巨大的市场潜力,使真正的工业机器人的已经在市场上崭露头角,以满足人们日益增长的需求,我们不能没有一个高性能的语音识别系统。由于工业机器人是面向生产实际的需要,最好的工作方式是让机器人能顾听懂最常见的人类语言,完成指定的工作,并能与人交流。机器人语音识别是机器人研究领域中的语音识别应用,最终的目标是让机器人了解人们的口头语言,然后按照人们的命令来行动或反应,从而形成一个良好的人机对话系统。为了能够进一步推动智能机器人的开发应用,因此,在语音识别机器人的研究领域中,机器人语音识别系统是工业机器人的实际推广应用,具有重要的意义。
  语音识别技术在智能机器人中的应用已经有很多年的历史,作为智能机器人的一个分支,工业机器人得到了迅速发展,工业机器人通过语音识别从工业噪声中提取有效的语音命令。为了实现机器人在一些特殊工业环境中工作的目的,机器人要能够识别命令意图。语音识别技术,可以实现人机对话,从而让机器能模仿人类完成所有工作的分配,使其在各行各业中能够得以应用。目前所面临的实际问题是:噪声和干扰环境下对大型工业机器人的语音识别有严重的影响。在机器人识别领域,工业环境中的实时性是一个非常重要的任务。机器人在工业环境下应用的听觉识别是使智能机器人发展速率低的瓶颈。
  2语音识别系统的发展
  2.1语音识别系统的发展方向
  语音识别系统是基于一套应用软件系统的硬件平台和操作系统的一些。语音识别一般分为两个步骤。第一步是学习或培训。这一阶段的任务是建立基本单元的声学模型来进行识别和模型的语音语法分析等。第二步是识别或测试。根据识别系统的类型可以满足一个识别方法的要求,使用语音分析的方法来分析语音特征参数,并建立了比较和测量系统模型,根据一定的标准,鉴定结果。
  语音识别系统的应用可分为两个发展方向,其中一个是大词汇连续语音识别系统,主要应用于计算机的听写机,以及结合电话网或互联网的语音信息服务系统,这些系统是在计算机平台上的一个重要发展方向。其次是应用的小型化,便携式音频产品,如无线移动电话的拨号,语音控制车载设备,智能玩具,家用电器和其他方面的应用的远程控制,这些应用系统大多采用特殊的硬件系统来实现,特别是语音信号处理芯片和语音识别芯片,最近几年快速发展,为其广泛应用创造了极为有利的条件。
  2.2语音识别系统的模型与模式
  语音识别系统的核心是声学模型和模式分类。首先通过学习算法,训练语音声学模型的特点是通过学习过程来生成声学模型,这是识别潜在的模型的前提,是最关键的语音识别系统的一部分。声学模型的目的是提供一种有效的方法来计算特征向量的声音序列和每个发音模板之间的距离。人的发音在每一刻发音之前和之后都会受到影响。
  为了模仿自然连续的协同发音和识别不同的发音,通常需要使用复杂的声学模型。声学模型和语言的发音特点的设计是密切相关的。声学模型单元大小与单词发音,音节模式和音位语音训练数据大小有关,故要求其系统识别具有很大的灵活性。大词汇量语音识别系统,通常采用较小的单元和少量的计算,该模型只有较小的存储容量,减少训练数据的数量,但相应的声音定位和分割问题就显得更加困难,规则识别模型变得越来越复杂。通常大型模型中识别单元包括协同发音,这有利于提高系统的识别率,但训练数据也相对增加。必须根据不同语言的特点来识别词汇,词汇量大小决定单位大小。
  参考文献
  [1] 李昌禄,苏寒松.?基于单片机平台下语音识别技术的应用方式[J].实验室科学,2009(06).
  [2] 薛同泽,陈书旺.?语音识别的智能门控系统设计[J].微计算机信息,2008(14).
其他文献
摘 要 云计算(Cloud computing)已经成为了IT界的热门技术,甚至被视为将根本改变生活方式和商业模式的革命技术。借助云计算,网络服务提供者可以在瞬息之间,处理数以千万计甚至亿计的信息,实现和超级计算机同样的效能。云计算可以被视为网络计算和虚拟化的融合:即利用网格分布式计算处理能力,将IT资源构筑成一个资源池,再加上成熟的服务器虚拟化、存储虚拟化技术,是用户可以实时的监控和调配资源。 
超壏芯片  为了满足OEM厂商对更多功能和更高性能的需求.德州仪器(TI)一如既往地利用其先进的数字信号处理器(DSP)技术为开发人员提供每MHz与每单位成本更高性能的解决方案。
嵌入式开发人员面临的最大挑战之一是如何为其下一个设计选择合适的处理器.在市面上大量现成的嵌入式处理器中,设计人员必须仔细挑选能够同时符合功能、性能和价格要求的型号
当论文的主体是以人为研究对象时,作者应说明其遵循的程序是否符合《赫尔辛基宣言》的基本原则,是否符合负责人体试验的委员会(单位性的、地区性的或国家性的)所制定的伦理学标准。作者须在文中标注伦理批文号,并提供该委员会的批准文件复印件及受试对象或其亲属的知情同意书副本。
摘 要 麦克风阵列信号处理是数字信号处理领域的一个热点问题,对麦克风阵列接收到的信息量,根据各个阵列之间信息的相关性,可以使用融合处理的方式实现对参数的估计,这种融合不仅可以在时间域处理,也可以在频域处理。麦克风阵列信号处理技术能够在统计意义上得到测量数据,该技术已应用在无线通信,雷达,声纳与工业控制等场合得到了广泛的应用。  关键词 声源定位 麦克风阵列 数字信号处理 三维空间 可控波束  中图
随着LED的广泛应用,新的LED驱动器也在不断地提供给设计人员.本文介绍几款新的LED驱动器.
摘 要 近50年来中国雾霾天气总体呈增加趋势,且持续性霾过程增加显著。本模拟装置的设计旨在通过对雾霾天气中PM2.5细小颗粒物浓度的测量、感应进而控制电动自行车的速度以达到安全行驶的目的,并使驾驶人员尽可能少吸入大气中的细小颗粒物。本模拟设计采用5V直流电机来代替电动自行车电机,用单片机系统最终实现了  关键词 雾霾路段 电动自行车 车速控制 装置 系统硬件设计  中图分类号:TP23 文献标识码
[本刊讯]7月20~21日,贯彻“一带一路”战略创新发展成果交流大会在新疆特变电工股份有限公司亚欧论坛国际会议中心召开.会议的主题是:贯彻“一带一路”国家战略,促进交流、合
期刊
本文围绕锡山职业教育实践,探讨了锡山职业教育实践的举措,包括转变教学方式,采用多媒体课件开展教学实践、引进虚拟实验室,改善教学策略等,希望以此为广大研究职业教育数字
汽车行业的发展和居民用气量的增加带动了CNG加气站的发展,使得越来越多的CNG加气站在各个地区应运而生,而当今的时代发展趋势要也注定了CNG加气站将更加,深刻地影响着我们的