基于SOM网络的语音基频模式提取研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:hotmail124
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的发展,计算机与人们的生活已密不可分,如何才能方便地与计算机进行交流成为人们需要解决的一个重要问题。语言是人类最方便的交流方式,因此人们希望能够采用语言与计算机直接进行交流,也就是实现人机之间真正的语声通讯。作为这一要求的计算机自然语言输出部分,文语转换系统近几年来发展的非常迅速,涌现出了大量的新技术。韵律模型在文语转换系统中是必不可少的。它将文本分析和语音生成联系起来,起着一个重要的桥梁作用。好的韵律模型,使之能够更加贴近自然语言中的各种韵律现象,是高自然度文语转换系统中的重要组成部分。而基频模式的提取是研究韵律规则的基础。因此,本文对如何提取基频模式进行了深入的研究。主要研究成果如下:1.为了获取用于聚类的基频序列,对语音数据进行了一系列的预处理工作,有音节切分、基频标注、长度规整、滑动平均和零均值化等工作。2.研究了两种常用的聚类算法:K均值法和ISODATA法。在此基础上,考虑到SOM网络独特的无监督、自组织和本身具有的聚类功能,提出采用SOM算法作为基频模式提取的聚类算法,克服了其他算法的一些不足之处。3.以一个特定语音库作为实验数据,用SOM算法对预处理后的基频序列聚类,得到15种典型的基频模式,并给出相应的基频曲线。在提取基频模式后,需要通过决策树的方法挖掘出具体的韵律规则,来指导语音的合成。这将是下一步要进行的工作。
其他文献
为解决目前工作流引擎产品存在的种类繁杂。兼容性能差等问题,探讨了工作流。工作流管理系统。工作流引擎的基本概念以及国内外研究现状,在深入分析相关理论。技术和方法的基
支持向量机是建立在统计学习理论基础上的一种新型机器学习方法,较好的解决了非线性、高维度、局部极小等问题,成功的应用于小样本、高维度数据的学习中。但是,当训练样本中含有
跨站脚本(XSS)攻击是目前Web应用程序最大的安全问题之一。最近研究人员提出的漏洞检测模型XSS-SAFE通过Java Script的特征注入和Java Script源码注入消毒程序完成自动化的XS
作为应用于自治系统之间交换域间路由信息的协议,边界网关协议BGP已被广泛地使用。但随着网络规模的快速扩大,网络拓扑结构越来越复杂,传统的协议实现方法已不能满足网络管理
人脸检测作为智能人机交互技术中的一个重要组成部分,是当前模式识别、人工智能、计算机视觉等领域的研究热点,近年来受到研究者的广泛关注。多姿态变化是人脸检测中一个突出
近年来,由于医学影像技术快速发展,现在的医学影像成像手段种类越来越多,成像方式各异,显示方式种类也众多,这些技术、方法既各有所长,也各有不足,到目前为止还没有一种堪称完美的成
客户的服务需求往往需要多种服务资源整合到一起才能满足,而不同的服务资源一般来自于不同的服务资源提供者。传统方式下中间代理负责处理客户的服务需求,中间代理与各个服务
多相流参数的检测技术是一个迫切需要发展的研究方向。但是由于多相流之间存在着相对速度和界面效应等问题,导致了多相流参数检测的难度系数较大。经过近几年来的研究发现,过
基于位置服务的研究和应用在人们的生活以及各个行业中已经十分普遍,其中最重要的研究内容的LBS(LBS:Location Based Service),即基于位置感知的移动服务也已经成为人们争相
随着日益严格的排放法规的实施及用户对汽车动力系统经济性、可靠性的要求越来越高,对汽车安全、舒适等方面的要求也不断提高。传统的机械装置与技术在汽车领域的应用已趋于