基于语音生成和获取中声音分类学习的神经模型研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:fengyun816ok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人类的各种运动控制任务中,语音生成任务恐怕是最为复杂的。在当前真正具有生物学意义的语音生成和获取神经网络模型中,DIVA模型的定义和测试相对而言是最彻底的,并且是一种唯一应用伪逆控制方案的模型。这种控制方案对于人类发音器官的运动学数据提供了十分精确的解释。在呀呀学语期间,每当婴儿产生一个其母语的语音时,DIVA的语音识别系统便对婴儿的语音信号进行解释,并激活语音映射中的对应细胞。但由于这个语音识别的过程过于复杂,所以在当前DIVA模型中该系统是作为一个专家系统来实现的。本文首先回顾了语音生成与获取模型的发展历程,介绍了语音识别技术的发展和现状。然后对DIVA语音生成与获取模型进行了介绍,包括DIVA模型的基本概念,结构框架以及模型的现状和不足之处。研究讨论了进行语音识别前的语音预处理和特征提取的主要方法和过程。提出了一种能对知觉磁效应现象进行解释的基于自组织特征映射体系结构的神经模型,并对模型的可行性和正确性进行分析,用计算机仿真方法进行了验证。针对当前DIVA模型的语音识别系统仅仅是一个专家系统的问题,对前面提出的神经模型进一步进行算法改进并应用到DIVA模型中,从而实现对DIVA模型的语音识别系统进行改进,仿真实验结果说明我们基本上实现了的对DIVA模型的预期改进目标。最后,对研究内容进行了总结,指出当前研究存在的不足之处,并指出了后续的研究方向,为进一步的研究开拓了思路。
其他文献
数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。数据仓库中的数据量非常大,并且在逐年增大。因此提高查询速度是数据仓库必须要
互联网的快速发展及电子信息的迅猛膨胀带来了严重的“信息爆炸”问题,用户可以通过网络获取到最新信息,同时,鉴于网络的开放性这一特点,用户就会不可避免的接触到暴力、色情、封
"十一五"以来,在党中央、国务院和地方各级党委、政府领导下,各地、各有关部门认真贯彻落实国务院《关于进一步加强消防工作的意见》,我国消防工作取得了明显进步。但是,随着
人们的生活包含着各式各样的数据,许多数据中都含有很重要的信息。数据挖掘就是从海量数据中提取重要信息的一种技术。作为数据挖掘中的一个重要方法,聚类分析可以有效地将这
随着互联网的飞速发展,“信息过载”的问题使得电子商务推荐系统面临着如何定位用户兴趣及时提供准确产品的瓶颈。而协同过滤算法是在诸多推荐系统中使用最广泛和有效的算法
大数据时代,文本信息量呈爆炸式增长,想要从中筛选有用类别信息极具挑战。“基于词语”和“基于模式”是文本分类领域两种有效的处理途径。“基于词语”方法以其易操作性,深
云计算是一种大型计算资源共享模型。云计算平台在充分利用海量异构分布式资源的同时,可以向用户提供无处不在、方便、按需的网络计算资源服务。云计算的关键特征在于按需服
斜拉链机作为一种物料运输装置在工业生产领域得到普遍的使用,斜拉链机的滚轮是斜拉链机的重要组成部分,且在长期的负重工作中容易出现滚轮拖动滑行以及滚轮脱轨故障。目前对于斜拉链机滚轮的故障检测主要以人工为主,且现有的自动化检测方式存在诸多弊端,因此本论文提出一种利用图像处理来实现斜拉链机滚轮故障自动化检测的方法,并且设计实现了嵌入式检测终端、服务器软件以及客户端软件,最终构建了一套斜拉链机滚轮故障检测系
超声成像技术由于其独具的实时性、无损性、廉价性、可重复性好和灵敏度高等优点使其成为临床诊断的首选影像方法。然而由于超声成像机制导致了医学超声图像质量低下,从而使得
普适计算致力于将计算融入人们的日常生活中,将由计算和通信节点及系统组成的计算空间与人们生活的物理空间无缝地集成为和谐的人机交互信息环境。上下文感知技术是普适计算中