关于人工智能与语音识别技术的研究

来源 :科技尚品 | 被引量 : 0次 | 上传用户:heinblue
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:伴随着我国社会经济的不断进步,科学技术水平越来越高,信息化的人工智能技术得以应运而生,尤其是其中的语音识别技术已经成为人工智能领域当中一项不可分割的重要组成部分,被广泛运用在各行各业当中。为此,本文将通过对人工智能的关键要素进行简单分析,结合语音识别技术的具体内涵及相关原理,以传媒领域为例,着重围绕人工智能与语音识别技术进行分析研究。
  关键词:人工智能;语音识别技术;传媒领域;具体运用
  0 引言
  自从物联网出现以来,一直是社会大众广泛关注的焦点,而作为与其他事物进行有效链接的关键,人工智能以及语音识别技术也同样掀起了一股全新的关注热潮。人工智能也正在逐渐同各行各业相互融合,其中以语音识别技术为代表,在我国教育、医疗、家居、金融等各领域当中均能够看见语音识别技术的“身影”。而随着近些年来我国传媒领域的不断发展,人工智能与语音识别技术也同样得到了广泛运用。
  1 人工智能的关键要素分析
  作为计算机科学的一大分支,人工智能简单来说就是模拟人类思维意识的信息过程,并产生出一种全新的、能够做出类似人类思考及反应的智能机器。而包括机器人、语音识别、图像识别等在内的各领域均属于人工智能的研究范围,本文将对构成人工智能的三大要素进行简要分析。
  1.1 深度神经网络
  深度神经网络被看做是统计模式识别中的一个分支,但当前其已经逐渐同互联网和IT产业进行有机融合,并逐渐成为人工智能的关键核心。其作为一种感知智能模型能够对生物视觉皮层当中负责识别的腹侧通路进行高度模拟,同时使用成千上万各神经元与突出连接权参数,使其与皮层功能柱等生物系统不断趋近。在大数据以及GPU计算硬件的帮助下,能够自动提取原始数据中的分层特征,从而为人工智能的深入发展奠定良好基础。
  1.2 大数据
  大數据简单来说就是一个庞大的数据集合,通过借助云计算优化整合、分析处理海量的信息数据,完成对传统数据研究及应用的深化。当前,大数据的数据量已经升级至PB甚至达到EB级别,数据来源越来越广泛、类型也越来越多,同时其高速的处理速度以及较高的安全性和可靠性也成为大数据的强大优势。在人工智能当中,大数据与深度神经网络同样发挥着至关重要的基础作用。
  1.3 涟漪效应
  涟漪效应具体而言指的就是每一位用户的个人经验、知识数据等能够在互联网以及移动网络的强势介入下加入到人工智能技术研究当中。譬如说在最初的语音识别系统当中,其实际真实率只有半成左右,但在系统上线运行的过程当中不断有用户贡献出相关数据信息,就像水波纹扩散一般帮助系统进行不断地优化和完善,从而有效推动人工智能的可持续发展。
  2 语音识别技术的简要概述
  2.1 具体内涵
  语音识别技术也常常被人们称之为自动语音识别,旨在利用案件、二进制编码等将人类语音中的词汇及内容转换为计算机可读输入。目前该项技术主要包括了语音拨号及导航、室内设备控制、语音文档检索等,而将其与机器翻译、语音合成等其他相关自然语言处理技术相互结合之后能够构建出例如语音到语音翻译的更为复杂的应用。
  2.2 技术原理
  首先,语音识别技术需要提取语音的特征参数,也就是语音信号中的有效数据信息,之后与语音基音、鼻辅音的元音、频谱,擦音的频谱等重要参数进行充分结合,使其能够完全匹配音频模型或模式。而人工智能网络、动态时间规整技术以及HMM模型技术则构成了完整的音频训练模型。人工智能网络可以模拟人类的大脑活动,并能够完成语言学习、判断、概括等功能,从而使得语音识别能够更加智能化。而动态的时间规整技术则能够统一音频口令的时间特征,并维持口令单词时间轴走向的稳定性,使口令特征完全匹配于模型特征,进一步提高语音识别的准确性和有效性[1]。
  3 人工智能与语音识别技术的具体运用——以传媒领域为例
  3.1 提升采编效率
  以专门用于整理录音的转写平台为例,记者将一小时音频上传五分钟后即可收到转写文本,而这将比手动听打方式整理录音的效率高出整整47倍。通过使用语音识别技术,记者只需在听审系统当中预先设置好禁忌词,并输入需要听审的节目后,系统将会自动进行听审而其一旦检测到禁忌词后便会发出警报,从而有效提升听审成效。
  3.2 优化传播形式
  在通过运用语音识别技术之下,其中的VAD端点检测、分段以及语义理解技术能够帮助工作人员自动生成字幕,而工作人员在进行简单的修正与审核之后即可直接使用其作为电视节目、音频节目等相应配套字幕。尤其是各种转写网站的相继出现,能够实现将音频自动转写为文本并直接转化成字幕格式,大大提升了制作字幕的效率。另外在人工智能的发展之下,包括听书、荔枝FM等各种新型APP相继出现,在语音识别技术的帮助之下不仅能够随意添加字幕,而且有效扩展了传播形式,进一步扩大传播范围。
  3.3 实现机器写作
  以15年出现的自动写作机器人“快笔小新”为例,其在经过获取和分析数据之后,自动从中提炼出观点并生成相应的格式与结构,即可完成初版发布。从本质上来说,机器写作就是将大数据分析和处理技术以及自然语言生成技术进行有机结合下的产物,目前机器写作的内容主要集中在需要较强数据分析性的财经新闻、体育赛事、气象预测等方面,而具有明显个性化、叙事性特点的娱乐新闻、时政要闻等还需要结合人工智能等技术进行深入研究。
  4 结语
  总而言之,伴随着人工智能与语音识别技术研究的不断深入发展,我国正稳步走在发展人工智能的康庄大道上,在这一良好的发展势头之下,人工智能与语音识别技术的相关研究人员,还需要进一步加大研究力度,坚守用人工智能建设美好世界的初衷,努力带领人类走向真正的人工智能时代。
  参考文献
  [1]杨震,杨宁,徐敏捷.面向物联网应用的人工智能相关技术研究[J].电信技术,2016,(5):16-19,23.
  (作者单位:清华附中 创新1班)
其他文献
摘 要:本文介绍了应用于600MW火电机组即以上大型机组的回转式空气预热器(以下简称空预器)漏风原理及降低漏风率的对策。通过分析漏风产生的原因提出双重密封或多重密封降低漏风系数,降低间隙面积,控制空气侧与烟气侧的压力差等漏风控制方法,降低机组空预器的漏风量,为机组安全、高效、环保、节能运行提供了有力的保证。  关键词:空预器;漏风系数;漏风控制  1 回转式空预器漏风问题分析  回转式空预器是大中
本文主要介绍了软件质量的内涵,软件质量控制以及软件质量保障的重要手段软件测试,其中重点阐述了如何提高软件质量等问题.最后简单介绍一种软件开发中可以使用的保证软件质
目的 :探讨X刀靶心定位的精度.材料与方法 :国产加速器与国产X刀配合使用.利用X刀等中心校验装置、头模等校验X刀靶心定位的精度 ,其中重点检测了X刀机械系统的等中心精度.结
摘 要:湿式电除尘器在实现超低排放的PM2.5污染物和重金属的污染控制上取得了良好的效果,在环境保护和环境颗粒物污染控制技术政策的草案中说明了关于火电厂电除尘湿法烟气脱硫的新技术的实行,以防止出现“石膏雨”和“蓝色烟”,因此有必要对湿电除尘技术进行研究与应用。基于此,本文主要对湿式电除尘器安装与维护技术进行分析探讨。  关键词:湿式电除尘器;安装;维护技术  1 前言  近年来,环境污染问题越来越
摘 要:近几年,随着计算机的快速发展和科學技术的进步,数字图像处理技术也得到了很大的重视和发展,并从实验室、工业领域走向了人们的工作和生活等办公室和商业领域。本文重点研究以MATLAB为基础的数字图像处理技术在社会各个领域的运用。  关键词:MATLAB 数字图像处理技术;应用  1 前言  MATLAB是美国mathworks公司研发出的计算机软件语言,经过不断的改进和完善,在目前已成为最优秀的
摘 要:编制能源平衡表是钢铁企业能源管理中的一项重要工作,也是钢铁企业节能增产及合理地分配能源的重要依据。鉴于目前企业通常采用Excel编制能源平衡表的现状,本文提出了一种基于分层设置,可自动审核、灵活输出的设计思路,并结合企业实际情况研发一套适用于钢铁企业的能源平衡表管理系统。  关键词:能源平衡表;分层设置;自动审核;灵活输出  能源平衡表是根据能量在转换过程中始终保持总量不变的原理进行编制。
随着社会经济的不断发展,人们生活水平不断提高,对电力资源的需求越来越大,这就对电力企业提出了更高的要求。对于新形势下电力企业而言,后勤管理工作对于整个企业的正常运营
摘 要:转炉活动煙罩提升装置是转炉炼钢的重要辅助设备之一,常用的形式有机械重锤式和油缸提升式两大类。本文分析了这两大类提升结构的优缺点,并提出了一种结构简单,工作可靠的新型结构。该机构已成功应用于多个工程项目,取得较好的经济效果。  关键词:转炉;活动烟罩;提升装置;单点液压提升  转炉活动烟罩用来收集从炉口喷出的炉气及燃烧产物,并控制冶炼时进入烟道的野风量回收煤气减少烟气外泄。活动烟罩采用汽化冷
本文将信号流图和数字仿真方法用于采用定点结构的数字校正算法中的增益分配,既避免了数据饱和,又使各状志变量有较大的线性范围,有利于保证数字校正的运算精度。 In this p
本文分析了缺乏有效的监管、综合管理水平不高、工程技术管理工作落实难、工程技术管理人员的水平不高等电力工程技术管理存在的难点问题,提出了要提高电力工程技术管理水平,