基于DIVA模型的汉语语音音素加工机制研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:zemo283167
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类大脑处理语音任务的过程较为复杂,已引起越来越多研究者的关注。DIVA(DirectionInto Velocities of Articulators)模型是一种神经计算模型,能够较为准确地描述语音生成和理解过程中相关脑区的作用,并模拟其工作流程。由于具备较高的精确度及开放性,此模型近年来受到多方面的关注与研究。研究中发现,由于语音处理过程复杂程度较高,该模型所模拟的发声过程和实际生理发声过程有一定出入,没有达到理想的效果。因而本文对原有模型进行了一定改进,通过引入另一种延时机制,即常延时机制,使模型工作流程更加合理,拥有符合现实意义的模拟效果。在仿真实验中引入新延时模块后,模型的发声过程令人满意,更加接近生理发声过程。临床研究表明,中文与英文发声过程具有一定差异,人脑对于两者的处理机制不同,我们希望能通过语音模型模拟两者的发声过程,并比较两者区别。因而本文利用DIVA模型为基础,在构建适合模型的中文音素建模单元集后引入音调函数机制,使其能够模拟中文发声,并籍此比较中英文语音处理机制的区别。仿真实验结果表明,模型产生结果基本符合临床观察结果。
其他文献
建立闭环故障报告、分析和纠正措施系统(FRACAS)已经成为企业实现产品可靠性维修性增长的重要手段。工作流技术是目前发展比较迅速的技术,其主要特点就是采用计算机技术,使业
随着Internet的广泛应用而兴起的IP电话,正以其低廉的通话费用及其诱人的市场前景对传统电信业务形成猛烈的冲击。在中国的IP电话领域中H.323已被广泛应用。同时也应看到SIP
GALS(Globally Asynchronous Locally Synchronous)思想提出:从局部而言,芯片内部的各模块采用同步电路设计方法;而从全局而言,各模块彼此时钟异步,以各自工作频率独立运行,整块芯
随着Internet的不断发展,人们越来越多地从网上下载并使用程序,程序信息流安全问题越来越重要。程序信息流安全问题是指程序能否保护重要数据的机密性和完整性。数据机密性的保
移动自组网是一种不依赖任何固定基础设施的无线移动多跳网络,正被越来越多地应用于军事、紧急救援、家庭娱乐等各种领域。这种网络除具有移动性、动态性、多跳性、临时性、自
随着Internet的普及,出现了很多基于Web的可检索的在线数据库,其中隐藏了大量的信息,我们称之为“深网(DeepWeb)”。这些可检索在线数据库的出现给数据集成领域带来了许多新的问
随着计算机技术和网络技术的飞速发展,各种层次硬件的出现以及硬件水平不断提高,出现了以嵌入式设备为主的监控仪器仪表,而且信息家电的网络化已经成为趋势。目前在网络应用层数
无线传感器网络(WSNs: Wireless Sensor Networks)结合了嵌入式技术、无线通讯技术、传感器技术和计算机网络技术等多个领域的技术。这种网络通过众多传感器节点能够实现即时的
目前,模糊集理论和粗糙集理论已成为知识获取的两种重要数学工具。模糊集理论是一种用精确的数学语言对模糊性进行描述的方法,而粗糙集理论是建立在分类基础上的,将知识理解为对
学位
Native XML数据库是当前数据库领域的研究热点之一。XML文档在Native XML数据库中的存储和索引策略,是首要关心的问题。首先,本文探讨了XML与数据库的相互关系,研究了XML文档在N