基于支持向量机的语种识别研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:yzgsmallfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着语音识别技术的不断发展,语种识别作为语音识别的一个方面和它具有的重要意义,也越来越受到人们的广泛重视。语种识别就是用计算机来自动识别一段发音所属语种的一项技术,它是在语音识别基础上发展起来的。从上个世纪七十年代到现在,语种识别虽然只经历了短短几十年的发展,但识别方法已有多种。这些方法虽然各有特点,但比较成熟的方法还不是很多。目前,我国对语种识别的研究较少,尚处于起步阶段。 语种识别强调在与文本无关和与说话人无关的条件下进行,因而语种识别需要尽量消除语音信号中个体发音的差异,并且尽量找到不同语种的语音间不同的声学特征,从而达到更好的识别效果。 本文首先从语种语音特征方面进行分析,找出不同语种之间的差异,提取语种语音特征参数,特征参数以矢量形式表现。 然后提出利用加权的K近邻法对训练矢量进行野点排除。对于每两个语种间的每个训练矢量,分别找出与其欧氏距离最小的前K个矢量,判断其类标与它的K近邻中多数类标的符号是否一致。在K近邻的特征矢量中各个矢量对于判断是否剔除对象特征的贡献不同。最近邻的贡献为最大,第K近邻的特征的贡献为最小,可以分配不同的权值给K近邻矢量。对K近邻矢量符号加权求和后,判断是否与对象矢量符号相同,若相同则保留,否则该对象矢量属于异类将该特征矢量删除。最后利用剔除完野点的训练矢量来训练one-against-one支持向量机(SVM),利用one-against-one支持向量机对测试矢量集进行分类投票,获得投票数最多的语种被判定为未知语音的语种。 实验结果表明,在较小规模训练矢量集下,KNN-SVM的平均识别率为78.66%,SVM的平均识别率为76.15%。在相同训练矢量个数下,KNN-SVM的支持向量个数要低于SVM,导致所需分类时间也低于SVM。KNN-SVM的性能要优于SVM。
其他文献
随着计算机和网络技术的迅速发展,网络安全成为世界各国共同关注的焦点。入侵检测技术是继传统的安全保护措施之后新一代的安全保障技术。作为信息安全保障中的一个重要环节,它
图像修复是指填充图像内指定区域的缺损数据的处理过程。这项技术已经被广泛用于各个领域,包括医学图像的修复、文物的修复、犯罪现场的还原、电影胶片上划痕以及污迹的消除
在软件生命周期中,软件测试是保证软件质量的关键环节之一,随着面向对象技术的广泛应用,使得面向对象的软件测试的研究也越来越受到重视。但面向对象程序的封装、继承、多态
现如今各行各业的数据每天都在快速增加,学术界和企业发现这些数据中隐藏着巨大的价值。在这种需求下各种数据分析框架和平台发展起来,其中Hadoop是目前最流行的开源平台,该平台
数字图书作为一种新型的电子媒体在我们的日常学习和生活中发挥着越来越重要的作用,从近几年的发展来看,其应用是比较成功的,不少公司均推出了各自的数字图书产品面向市场,服务于
数字签名技术在身份识别和认证、数据完整性、抗抵赖等方面具有其它技术所无法替代的作用,它在军事、电子商务和电子政务等领域有着极广泛的应用。论文在前人工作的基础上,着重
机械驱动传动装置作为一个测试机械振动和机械驱动特性的设备,主要用于测试专业机械设备的振动特性和各个力学参数。一般情况下,振动对机械部件是有害的。机械振动往往会破坏机械部件正常工作和原有性能,也会在运动中形成动载荷,加速机械部件失效,缩短使用寿命,甚至导致不可逆的损坏。为提高机械部件的可靠性,有必要对机械部件进行机械结构振动分析和测试,也有必要获得机械部件的力学模型参数,如弯曲刚度,支撑刚度,扭转刚
电子商务已经成为企业经营活动的重要组成部分,企业电子商务系统的综合性能直接体现着企业的服务水平和竞争力。电子商务性能测评是衡量电子商务平台整体水平的主要途径,目前,设
组播作为一种高效网络数据传送技术,已经在各种宽带应用领域得到广泛应用。目前,组播主干网的核心路由器速率已经达到2.5Gbps~10Gbps,这一速率要求核心路由器每秒能够转发几百万
学位