支持向量机语音识别系统的数据分析预选取算法研究

来源 :太原理工大学 | 被引量 : 4次 | 上传用户:ssm3695
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着基本科学理论的不断发展,人工智能技术也随之有了不断的提高,有了很大的应用空间。基于人工智能算法的语音识别技术逐渐成熟,识别系统的功能越来越强大,能实现人机交互、语音控制等。支持向量机是一种基于统计学的识别算法,它克服了训练集样本数量少、线性不可分、维数灾难和局部最优等问题,有较好的泛化能力和较高的分类能力,适用于语音识别系统。支持向量机解决了数据样本较少的这一问题,但是支持向量机的训练过程中涉及到了大量的矩阵运算和核矩阵的存储问题,出现了训练时间过长的现象。本文的研究目的就是缩短大数据量下支持向量机训练时间。本着这一目的本文从输入语音识别系统的数据维数方面,采用主成分分析法对语音的美尔频率倒谱系数做降维运算,并且通过主成分的特征值贡献度这一参数保证语音识别系统的识别精度不下降,以期大幅降低了支持向量机训练时间。另外,本文利用支持向量机中只有支持向量对训练得到的模型中的决策函数有贡献这一原理,从数据的选取和训练方式的角度提出了分组训练预选取算法,减少了训练数据中的冗余部分,同时新颖的分组方式在局部上减少了子系统的要处理的数据量,以此来降低语音识别系统的训练时间。最后通过在大样本数据集下的实验,验证了在不同规模、不同信噪比语音样本之下将主成分分析法应用到美尔频率倒谱系数中和分组训练预选取算法都可以缩短支持向量机的训练时间,证实了本文提出的两种方法的有效性。
其他文献
压缩感知是针对稀疏或可压缩信号,在信号采样的同时并进行适当压缩的新理论,其采样速率远低于奈奎斯特采样速率。测量矩阵在信号采集和信号重建环节中发挥着至关重要的作用,
水声探测的核心问题之一是目标声源的被动定位问题。被动定位问题本质是逆问题推断,通过对传感器阵接收的含有噪声的目标辐射声信号在空间和时间上采样、分析,结合传播模型和先验知识等正向知识,推断目标所在的空间位置。目标辐射声信号是在一个上下有界,左右无界的三维波导内传播,是三维声场,目标位置具有三维属性。通常使用的水平线阵或垂直线阵都只是在一维声场上进行采样,没有对三维波导进行充分的空间采样,因而不具备对
近年来,数字化医院的建立对PACS (picture archiving and communication system)系统的需求不断增加。而数字化影像设备的广泛应用使医学数据呈爆炸式增长,给PACS系统中有限
无线射频识别(Radio Frequency Identification,RFID)技术,是一种利用射频无线通信实现的非接触自动识别技术。伴随着物联网技术的发展,符合ISO/IEC18000-6C协议的超高频(UHF
颅内出血(ICH)是最严重的急性脑血管疾病之一,也是急性神经紊乱疾病,如偏瘫等的重要发病诱因。对于临床治疗来说,颅内出血的分割具有重要意义。因此,如何应用CT图像诊断颅内
随着人类科学和信息技术的发展,计算机与人类的生活越来越紧密,新型人机交互技术逐渐成为研究热点,语音情感识别作为一种提高计算机智能化、人性化水平的新技术具有重要研究价值
随着无线通信技术的快速发展,无线频段的频谱拥塞问题愈发严重,因此,在频谱资源有限的情况下研究能够提高频谱利用效率的新型无线通信技术具有重要意义。研究表明,轨道角动量
在无线通信领域,通信能力和通信安全是两个最值得关注的方面。在通信能力方面,中继技术作为一种提升系统吞吐量和扩大系统覆盖范围的技术,正受到越来越多的关注。在通信安全
家庭用户对利用室内多个不同类型的家庭设施和终端提供不同种类多元化信息服务的需求日益增多,因而如何对家居环境中异构多终端复杂信息进行采集、获取、分析和处理,满足用户的
独立模式的免许可频段的长期演进(Standalone Long-Term Evaluation in Unlicensed band,SALTE-U)系统是缓解许可频段资源稀缺和移动数据流量激增矛盾的主流解决方案之一。然