汉语耳语音话者识别研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:lisenrui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语耳语音话者识别可应用于国家安全的某些特殊需要、电话银行、特殊场合的身份确认、公众场合下的通讯等方面。它是一个全新的课题,有许多问题亟待解决。 本文介绍了耳语音的生理、声学和感知特点,指出共振峰位置与感知特性的变化是耳语音与正常音一个主要的差别。为了解决耳语音话者识别问题,就应修正这些差异。 本文通过滤波器组分析的方法研究了耳语音的频率特性。通过3个评估函数(F比、识别率和主分量分析),研究表明对于耳语音话者识别第一、三共振峰所起的作用远大于其他共振峰。研究结果为耳语音话者识别研究奠定了基础。 根据耳语音的频率特性与感知特性,本文提出了包括MFCC<,M>,MFCC<,Exp-Log>,WSCC与WWCC在内的一系列特征参数。这些参数具有高性能,鲁棒性好的优点。实验表明新的参数可以有效地提高耳语音话者识别系统的性能。 对于话者识别,隐马尔科夫模型往往需要大量的训练数据。但是在一些特殊的应用中,这个要求难以实现。因此本文提出了正弦变化的变帧率训练来解决这个问题。我们将这个方法应用于耳语音话者识别系统中,在训练样本数仅为识别样本数1/4的情况下,系统的识别率有所提高。实验表明这种方法在一定程度下解决训练样本不足的问题。 对于话者识别研究,某些特征参数之间对于话者识别存在着一定的互补性。基于概率论与隐马尔科模型理论,本文提出了一种称之为最优参数法的有效结合各特征参数优点的方法以及修正隐马尔科夫模型。实验表明通过这两种方法来综合利用WSCC、LPCC以及其一阶差分系数建立的耳语音话者识别系统要优于传统的话者识别系统。
其他文献
本论文系统地介绍了SQUID的工作原理、高温超导SQUID的研究进展、生物磁信号的产生机理、MCG测量系统的构成及其在简易磁屏蔽条件下的具体应用。为了开发基于简易磁屏蔽设备
本论文工作采用“低能离子注入+高能重离子辐照”实验方法,通过建立注碳二氧化硅(SiO2)中结构变化和新结构形成与高能重离子辐照参数的关系,比较系统地研究了注碳SiO2中高能重
多铁性材料同时具有铁电、铁磁或铁弹等两种或两种以上的序参量,并且这两种铁性序参量之间的耦合将会为新型多功能器件的设计提供一个附加的自由度,因此它们在信息存储器、自旋
自六十年代发现类星体以来,活动星系核(AGN)一直是天文学和天体物理学中重要的研究对象。在观测到许多种活动星系核以后,人们尝试着用统一的物理机制来解释这些现象。Antonucci
学位
本文对经典热光的关联成像进行了研究。文章采用两种不同的类热光源,分别证明了经典热光关联成像公式的正确性。激光透过匀速旋转的毛玻璃所成的散射光,其强度在空间随机分布,满
描述材料状态有三个基本参数,即P、T、V。过去人们捕述材料的相结构通常只考虑温度T和压力P两个参数,而对体积V的考虑往往很少。本文研究了在介观尺度下,Ga的体积与其相结构的关
学位
本文研究在自旋极化电流作用下铁磁金属薄膜中自旋波、磁孤子和畴壁的动力学。 在宏观的磁动力学描述中,将自旋极化电流对局域磁化强度的影响约化为自旋矩,可得到一种推广的
纳米科技是21世纪发展最为迅速,研究最为活跃的领域之一。准一维半导体纳米材料因其独特的形貌和物理性质及巨大的潜在应用在纳米材料的研究中占有非常重要的位置。准一维半导
管壳式热交换器是热力管道系统中的重要设备,声学传递特性的计算是热力管道总体声学特性预估的关键技术环节之一。本文在常温和无流动条件下,从理论、数值仿真和实验三个方面对
单壁碳纳米管是一个中空的圆柱体,可以看作由单层石墨卷曲而成。它具有纳米数量级的直径和微米数量级的长度。碳管的这种特殊几何结构使得它具有很多奇特的性质,例如碳纳米管既