语音识别及端到端技术现状及展望

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:ch21st
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
通过对语音识别技术的发展梳理,简单介绍了语音识别的历史和应用现状,并将传统语音识别的技术和当前的研究进展进行描述.传统语音识别采用基于统计的方法,采用声谱特征,在GMM-HMM混合结构上进行训练和匹配.当前的语音识别模型主要基于深度学习的方法,采用CNN、RNN都可以有效的进行特征提取从而建立声学模型.进一步的研究采用了端到端的技术,避免了多个模型间的误差传导.端到端技术主要有CTC技术和attention技术,最新的模型和方法着重研究了attention技术,并在尝试进行与CTC的融合以达到更好的效果.
其他文献
语文课堂是教学活动中最重要的场所,在整体的课堂教学中,教师与学生都会投入更多的精力来对待学习过程,构建小学语文高效课堂对于学生的成长与学生综合能力的培养具有重要作
随着水资源的日益稀缺,基于水市场的可转让农用水权交易成为解决塔里木河流域水危机的主要途径.为此,本文在已有国内外水权交易及其市场研究的基础上,首先对塔河流域可转让农
石化股份有限公司是上海市的耗能大户。其中供热占有相当大的百分比,年平均供热量达760吨/小时左右,是目前国内最大的热网,供热管路总长为76公里,供热管径最大为争φ820&#215
<正> 后拱的关键作用是把炉排后部含有过量氧份的气体,导向燃烧中心,以供可燃气体在炉膛空间进一步燃烧的需要;同时以较高的流速把灼热的烟气逼近火床前部以加强对新进煤层的
目的探讨骨搬移后一期序贯髓内钉技术治疗胫骨大段感染性骨缺损的临床疗效。方法回顾性分析2014年9月到2019年4月应用骨搬移后一期序贯髓内钉技术治疗胫骨大段感染性骨缺损12
会议
不同的企业,因生产工艺、规模及所消耗能源的种类不同,故其能耗量也不尽相同.针对某工厂企业的能耗状况进行调查和分析,根据现场调查,并比较不同时间段的能源使用状况,分析造
罗文俊是我班的一个新生.刚入初一,我就发现的行为有些不对:一对机灵的眼睛总是东张西望,上课总坐不端正,要么斜靠在墙上,要么爬在桌子上,偶尔才看讲台,那眼神中有些琢磨不透
[目的]探讨子宫内膜癌发生的危险因素。[方法]收集2001~2002年海淀区户籍的在北京各大医院就诊并经病理证实为子宫内膜癌的患者临床资料70例。在同一社区人群按照1:3病例对照
<正> 锅炉在燃烧过程中,不可避免地会产生各种热损失,其热损失之和q_损为:q_损=q_2+q_3+q_4+q_5+q_6其中q_3为化学不完全燃烧热损失,一般不超过0.5%,q_3取决于炉膛温度、燃烧
以简单小室法研究了布洛芬分别在不加助渗剂、加1%月桂氮Zhe酮、加1%尿素、加1%月桂氮Zhe酮及1%吐温-80时渗过离体小白鼠皮肤的吸收效果。