基于单麦克风的说话人标记方法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:god_save_me
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于单麦克风的多说话人语音的自动标记技术是语音信号处理研究中具有挑战性的任务之一。“说话人标记”指在说话人个数未知的情况下对语音信号进行说话人自动分类(标记)技术,由于说话人数未知,因此实现准确聚类非常困难。多说话人标记过程通常包括说话人切分和说话人聚类两个方面的技术。其中说话人切分的目标是把不同说话人的语音段切分开,而说话人聚类的目标是把相同说话人的语音段聚合在一起或者打上同一个说话人的标号。本论文针对说话人自动标记方法展开了创新性研究工作。论文主要创新工作如下:  (1)从人耳的听觉机理出发,提出了一种稳健的说话人音高估值方法和一种快速的浊音、清音、静音判别方法,以及一种基于计算听觉场景分析的说话人切分的方法(CASA-SCD)。实验表明,CASA-SCD可以将说话人切分的F1分数由基线的65.9%提高到70.0%。  (2)从人的发声机理出发,首先利用语音生成模型和说话人的音高信息将语音信号分解为声门源信号和声道模型冲激响应信号,并提出了一种提取基于声门结构的说话人生物特征和说话人生物力学特征的方法、一种基于声门源和声道分离的说话人切分方法(GVS-SCD),以及融合听觉机理和发声机理的说话人切分方法(ADAT-SCD)。实验表明,GVS-SCD可以将说话人切分F1分数提高到72.6%,通过融合听觉机理和发声机理实现信息互补,ADAT-SCD可以将说话人切分F1分数提高到73.8%。  (3)提出了一种基于说话人子空间映射谱聚类的说话人标记方法(SSMSC-SD)。首先,利用ADAT-SCD得到的说话人切分段结果,提取出切分段的说话人i-vector矢量,并通过说话人子空间映射来增加说话人之间的区分性,然后计算目标说话人之间的相似度,最后通过谱聚类方法完成说话人聚类(标记)。实验表明,SSMSC-SD的说话人误判率为16.19%,说话人标记错误率由基线的28.4%下降到24.23%。  (4)提出一种基于局部引导模型的变分贝叶斯说话人标记方法(LGMVB-SD)。通过引入融合有静音、性别、音高信息的局部模型,实现一种新型的基于局部引导模型的变分贝叶斯帧聚类和段聚类,从而避免说话人切分不准的问题。实验表明,LGMVB-SD的说话人误判率为15.84%,说话人标记错误率由基线的28.4%下降到23.71%。  实验结果表明本文提出的说话人标记方法与最新发表的论文在RT09数据库的对比达到国际先进水平。
其他文献
以太无源光网络(EPON)以其高带宽和低成本等优势成为有线接入网的主流技术,WiMAX作为一种新型无线接入技术,则在支持高带宽、灵活接入方面具有优势。因此,进行EPON与WiMAX技
在设施菜地条件下,研究了配施双氰胺对土壤.植物系统NO3--N迁移累积和作物产量的影响。结果表明,配施2%、5%和10%浓度的双氰胺均可以有效降低设施菜地耕层土壤NO3--N的淋溶和累积,
水听器是探测水下声音信号的传感器,广泛用于水文测量、海底探测、水下生物种群监测、海洋石油勘探、船舶导航、水下作业、海军声纳系统等科研、生产和国防领域。对水听器性
本文致力于研究绝缘硅波导(SOI)中基于三阶非线性效应四波混频(FWM)过程的波长变换。目的在于了解SOI内部的非线性效应,寻找SOI波导以及基于此技术的商业设备的应用前景,探索并
正常妊娠的维持以及胎儿和母体的健康有赖于发育完善和功能健全的胎盘。胎盘主要由不同类型的滋养层细胞组成,以人胎盘为例,具有侵润能力的绒毛外滋养层细胞可通过侵润子宫蜕膜
随着网络技术高速发展,无线通信网络呈现出异构化的特点,如果这些异构网络无法实现融合,那么未来信息时代将存在许许多多的信息孤岛,因此异构无线网络融合是无线通信系统发展的重
microRNA(miRNA)是一类进化上保守的内源性非编码小分子RNA。miRNA通常长度约为22 nt左右,它们通过转录后抑制的方式调控蛋白基因的表达。他们调控靶基因的表达通常有两种方式
本研究通过室内培养、淋溶模拟和径流模拟试验,分别对酸性土壤(红壤)和不同质地碱性土壤(潮褐土和黑钙土)磷流失过程进行模拟研究。结果表明,不同土壤相同水分条件下,土壤磷流失
YABBY基因家族是种子植物中特有的一类基因。YABBY基因编码转录因子,参与调控植物发育过程的诸多方面。Drooping leaf(DL)是水稻YABBY基因家族的一员,其编码的蛋白N端具有保守
随着微电子技术的不断进步,传统的二维封装越来越难以满足新一代的技术需求。IC制造业也不得不面对芯片物理极限所带来的挑战。三维封装技术因其近乎理想的封装密度和优越的