一种基于CNN/CTC的端到端普通话语音识别方法

来源 :现代信息科技 | 被引量 : 0次 | 上传用户:huonu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了实现离线状态较高正确率的中文普通话语音识别,提出一种基于深度全卷积神经网络CNN表征的语音识别系统的声学模型,将频谱图作为输入,在模型结构上参考了VGG模型。在输出端,该模型可以与连接时序分类完美结合,从而实现整个模型的端到端训练,将声波信号转换成普通话拼音序列。语言模型则采用最大熵马尔可夫模型,将拼音序列转换为中文文本。实验表明,此算法在测试集上已经获得了80.82%的正确率。
其他文献
地下管线三维轨迹惯性定位是一种抗干扰能力强、定位精度高的地下管线定位技术。该文通过对REDUCT公司的两款惯性定位系统进行实验,定量分析了里程仪的误差及惯性定位系统的
背景和目的:宫颈癌发病率居我国妇科恶性肿瘤首位,具有恶性程度高、易发生侵袭转移、易复发等特点,严重威胁广大妇女的身心健康。在此基础上,从基因水平寻找新的诊治方法,成
本文分析了110例老年肺心病住院患者中发生多脏器衰竭(MOF)60例的高危因素,主要为受累脏器≥3个、病情严重性计分≥5分、呼酸十代碱和三重酸碱紊乱、序贯发生脑或/和胃肠衰竭以及
本文报告8例肌皮瓣移植(2例背阔肌、2例腹直肌、4例腓肠肌),采用带蒂、交腿、带血管蒂岛状的形式,治疗肩部、腕部、膝部等处深达骨、关节组织损伤、外露的严重电击伤创面,取得了良