【摘 要】
:
为了实现离线状态较高正确率的中文普通话语音识别,提出一种基于深度全卷积神经网络CNN表征的语音识别系统的声学模型,将频谱图作为输入,在模型结构上参考了VGG模型。在输出
【机 构】
:
华南理工大学自动化科学与工程学院,华南理工大学机械与汽车工程学院
【基金项目】
:
国家级大学生创新创业训练计划项目(201910561167)
论文部分内容阅读
为了实现离线状态较高正确率的中文普通话语音识别,提出一种基于深度全卷积神经网络CNN表征的语音识别系统的声学模型,将频谱图作为输入,在模型结构上参考了VGG模型。在输出端,该模型可以与连接时序分类完美结合,从而实现整个模型的端到端训练,将声波信号转换成普通话拼音序列。语言模型则采用最大熵马尔可夫模型,将拼音序列转换为中文文本。实验表明,此算法在测试集上已经获得了80.82%的正确率。
其他文献
地下管线三维轨迹惯性定位是一种抗干扰能力强、定位精度高的地下管线定位技术。该文通过对REDUCT公司的两款惯性定位系统进行实验,定量分析了里程仪的误差及惯性定位系统的
背景和目的:宫颈癌发病率居我国妇科恶性肿瘤首位,具有恶性程度高、易发生侵袭转移、易复发等特点,严重威胁广大妇女的身心健康。在此基础上,从基因水平寻找新的诊治方法,成
本文分析了110例老年肺心病住院患者中发生多脏器衰竭(MOF)60例的高危因素,主要为受累脏器≥3个、病情严重性计分≥5分、呼酸十代碱和三重酸碱紊乱、序贯发生脑或/和胃肠衰竭以及
本文报告8例肌皮瓣移植(2例背阔肌、2例腹直肌、4例腓肠肌),采用带蒂、交腿、带血管蒂岛状的形式,治疗肩部、腕部、膝部等处深达骨、关节组织损伤、外露的严重电击伤创面,取得了良