论文部分内容阅读
人类大脑处理语音任务的过程较为复杂,已引起越来越多研究者的关注。DIVA(DirectionInto Velocities of Articulators)模型是一种神经计算模型,能够较为准确地描述语音生成和理解过程中相关脑区的作用,并模拟其工作流程。由于具备较高的精确度及开放性,此模型近年来受到多方面的关注与研究。研究中发现,由于语音处理过程复杂程度较高,该模型所模拟的发声过程和实际生理发声过程有一定出入,没有达到理想的效果。因而本文对原有模型进行了一定改进,通过引入另一种延时机制,即常延时机制,使模型工作流程更加合理,拥有符合现实意义的模拟效果。在仿真实验中引入新延时模块后,模型的发声过程令人满意,更加接近生理发声过程。临床研究表明,中文与英文发声过程具有一定差异,人脑对于两者的处理机制不同,我们希望能通过语音模型模拟两者的发声过程,并比较两者区别。因而本文利用DIVA模型为基础,在构建适合模型的中文音素建模单元集后引入音调函数机制,使其能够模拟中文发声,并籍此比较中英文语音处理机制的区别。仿真实验结果表明,模型产生结果基本符合临床观察结果。