基于深度学习的维语语音识别研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户：ericlin1985

【摘要】

：

语音识别就是将原始语音信号识别成相对应的文本或者其它形式的可以被计算机所处理的信息。语音识别技术是人工智能领域一个重要的研究方向,具有很高的研究价值和商业价值。

【作者】

：

李鹏飞

【机构】

：

安徽大学

【出处】

：

安徽大学

【发表日期】

：

2016年期

【关键词】

：

语音识别深度学习声学建模深度神经网络长短期记忆网络语言模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音识别就是将原始语音信号识别成相对应的文本或者其它形式的可以被计算机所处理的信息。语音识别技术是人工智能领域一个重要的研究方向,具有很高的研究价值和商业价值。近年来,随着深度学习在机器学习和模式识别领域的兴起,以及深度学习所具备的超强建模能力,能从海量的数据里“学习”到有效的信息,迅速吸引了众多国内外研究者的关注。深度学习也被应用到语音识别领域,并且取得了很好的效果,基于深度神经网络-隐马尔科夫模型(Deep Neural Network-Hidden Markov Model, DNN-HMM)的语音识别框架更是迅速取代了传统基于高斯混合模型(Gaussian Mixture Model, GMM)-隐马尔科夫模型的框架,成为当今语音识别系统的标准配置。以往语音识别所关注的语种主要是那些使用人口多或普及率高的语言,比如汉语、英语、阿拉伯语等,研究过程中所开发的技术成果在不经过太大改动的情况下就可以直接被推广到具有相似特点的语种中。经过几十年的发展,这些语种的语音识别技术发展已经日趋成熟。然而一些像维吾尔语这样的小语种的语音识别技术在国外却没有得到广泛的关注和发展。随着新疆经济的快速发展,新疆也变的越来越开放,关于维吾尔语语音识别系统开发工作的必要性及极其广阔的市场前景是不可忽略的。本文对基于深度学习的网络模型及其建模方法做了详细分析,并将基于深度学习的语音识别技术用在了维吾尔语的识别上。1、研究了基于DNN-HMM的声学建模声学模型(Acoustic Model, AM)是语音识别系统最重要的组成部分,一个好的声学模型可以提高语音识别的系统性能。本文首先介绍了深度神经网络的网络结构以及算法,然后分别用300小时和500小时的维吾尔语语音数据训练基于深度神经网络结合隐马尔科夫模型的声学模型。通过实验发现500小时的训练集训出的声学模型比300小时的训练集训出的声学模型在词识别错误率上相对下降了3.03%,这说明训练集合越大声学模型识别率越高。2、研究了基于LSTM-HMM的声学建模介绍了循环神经网络(Recurrent neural Network, RNN),但由于RNN存在后面时间节点对前面时间节点感知力下降导致的梯度消失问题,因此研究了长短期记忆(Long-Short Term Memory, LSTM)网络。通过实验发现LSTM-HMM声学模型较DNN-HMM声学模型在词识别错误率上相对下降了12.49%,这说明LSTM-HMM声学模型较DNN-HMM声学模型有很大的性能提升。3、维语语言模型优化由于维吾尔语为黏着性语言,黏着语超大词汇量会带来传统整词语言模型数据稀疏、鲁棒性不强等问题。本文通过子词建模的方法对维语语言模型进行了优化,缓解了黏着语超大词汇量带来的传统整词语言模型数据稀疏性、鲁棒性不强等问题,使词识别错误率相对下降了2.4%。

其他文献

移动REID系统安全与隐私保护问题研究

移动RFID可定义为使用无线通信方式提供载有RFID标签的物品信息的一系列服务。在这类RFID应用中，RFID读写器被安装在如PDA或移动电话等可移动智能终端设备上，RFID读写器是可移

学位

移动无线射频识别移动RFID系统隐私保护安全认证协议信息安全

NC-OFDM系统中降低PAPR技术的研究

非连续的正交频分复用技术(NC-OFDM)是应用于动态频谱接入网络的一种可变数据传输技术,即通过收集利用大量未被主用户占用的非连续的子载波来实现高速数据传输,同时置空主用

学位

非连续正交频分复用峰均功率比相移算法交织算法自适应

基于独立分量分析方法的胎儿心电提取的研究

胎儿心电图(fetal electrocardiogram, FECG)包含了有关胎儿健康状况的重要信息,提取纯净的胎儿心电图具有重要的临床意义。由于母体腹部表面记录到的心电信号中胎儿心电信号

学位

胎儿心电独立分量分析遗传算法小波包

MIMO系统中的单载波频域均衡技术

在宽带无线通信系统中,随着数据速率的不断提高以及多入多出(MIMO)技术的引入,使得无线信道多径传播带来的影响日益增强。数据符号在时域的扩展带来明显的码间干扰,在频域上

学位

MIMO单载波频域均衡最小均方误差Turbo频域均衡

认知无线电网络中基于协作DF中继的联合资源分配策略研究

在认知无线电(Cognitive Radio, CR)网络中,次要用户可以动态接入主要用户的授权频谱,从而提高了频谱效率。CR技术作为一种解决频谱资源短缺问题的关键技术,是近期研究者关注

学位

CR网络DF中继频谱租借资源分配服务质量统计时延有效容量凸优化拉格朗日对偶

智能温控射频热凝器研制

经过大量的基础性研究和临床研究,智能温控射频热凝技术在疼痛等疾病方面治疗的效果已经得到了实践的证实。本文详细论述了智能温控射频热凝器的研制过程,并对其各部分的功能

学位

射频功率放大电路USB接口嵌入式系统DDS热电偶测温电路电源电路软件设计系统实验

超分辨率重建算法研究

图像复原技术应用广泛,近年来图像超分辨率重建技术成为图像复原领域中一个研究热点,该方法通过对图像序列作信息融合、去除模糊和去噪声等操作,从低分辨率序列的多幅图像中

学位

超分辨率重建图像序列最小二乘法自适应

星载干涉合成孔径雷达波束对准技术研究

本文的主要内容是星载干涉合成孔径雷达(InSAR)中波束对准技术的研究。由于SAR具有全天时、高分辨率和穿透一些地物的特点，使得它在地球科学、生态科学、水文科学等研究领域发

学位

星载干涉合成孔径雷达波束对准算法相控阵天线数据仿真频率估计

多传感器协同监视通信技术研究

随着国民经济的发展,人们的生活水平的升高,国民的安全意识不断增强,就这样监视系统走进了人们的生活。无论是国家安全方面的边防监视系统,还是民用安全方面的监视系统都有着

学位

传感器网络二叉树冲突分解方法ZigBee协议TEEN改进路由算法

基于强跟踪卡尔曼滤波的电压暂降检测

近年来,随着大量分布式电源和新型电力负荷接入电网,电网的负荷结构和电气特性发生了较大的变化,电能质量问题越来越突出。其中,电压暂降由于其危害程度大、发生频率高等特点

学位

强跟踪卡尔曼滤波电压暂降无迹变换渐消因子

基于深度学习的维语语音识别研究

与本文相关的学术论文