基于统计的与文本无关说话人识别系统研究

来源 :中国科学院声学研究所(北京) 中国科学院声学研究所 | 被引量 : 0次 | 上传用户:ghjkevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别系统根据语音自动识别说话人的身份,是一种基于生物特征的识别系统。本文从统计的角度出发,研究并确定了构成识别系统的各个基本环节和技术路线,建立了基于统计的与文本无关说话人识别系统的软件平台。在此基础上,本文深入研究了说话人识别系统的构造及基鲁棒性增强技术,并获得了以下成果和结论:   提出了基于通用字的GCB-HMM背景模型,并与GMM的说话人模型一起构成混合的识别系统。该模型一方面可以划分出输入语音中的语音段用于说话入GMM模型的训练或似然值的计算;另一方面还可以提供输入语音相对于背景的似然得分,用于归一化似然值。   提出了基于浊音的说话人识别系统,并针对不同的信噪比和噪声类别,与基于通用字的识别系统进行了比较。实验表明,采用基于浊音的说话人模型可以提高说话人确认系统对于噪声的鲁棒性。   建立了基于自适应GMM模型的说话人识别系统,并将非特定人的背景模型与特定人的cohort模型相结合,提出了似然得分混合归一化的方法。得分归一化技术可以减少话筒、信道等环境因素的影响,有助于在决策过程中采用统一阈值。电话语音条件下的说话人确认实验表明,在自适应GMM模型似然比得分的基础上,混合归一化的方法能获得最佳的识别效果。  
其他文献
十一届全国人大四次会议3月14日表决通过了关于国民经济和社会发展第十二个五年规划纲要的决议,决定批准.纲要提出,要深入实施科教兴国战略和人才强国战略,加快建设创新型国
本论文主要总结了我在南京大学介电体超晶格实验室(DielectricSuperLatticeLaboratory)近两年的研究工作中的一些初步进展和结论。主要囊括了以下几方面的内容: 1.较为系统
超强超短激光技术的发展为人类在实验室尺度内创造出前所未有的极端物理条件,对基础学科、前沿交叉学科和光与物质的相互作用等高科技领域的发展,起到了极大的推动作用。随着脉
该文采用液氮冷靶系统制取液氩样品,利用二级轻气炮作为加载工具对液氩进行冲击压缩,利用低温同轴探针和多通道瞬态高温计等实验设备测量了液氖的冲击压缩状态参量及其光谱幅
本文着重研究了光学时间反演镜技术,并对其进行了理论分析及改良,在此基础上将其推广应用到无线传感器网络(WSN, Wireless Sensor Network)上。无线传感器网络被誉为下一代的
空间光通信具有高速、大容量、低功耗、高保密性以及强抗干扰等独特优势,是目前通信领域的研究热点。其中,光束捕获、跟踪和瞄准技术是运动平台光通信系统研究的关键技术。传
该文就力图用全离子注入的方法去制造一种沟道长度仅有80nm(有效沟道长度50nm)的NPN型VDCFET.文章对离子注入的搭配、器件的制作工艺、电学特性的测量等相关问题进行了深入研
【教学目标】1.能联系上下文理解“能手”“直”“大吃一惊”“孤单失群”等词语的意思。理解“惊弓之鸟”的意思。2.分角色有感情地朗读表演课文,理解更羸最后说的四句话之
期刊
半导体量子点(quantum dots,QDs)玻璃是一类重要的纳米材料.半导体在玻璃基体中生长形成具有纳米尺寸的量子点,这是一个三维受限的准零维结构,具有显著的量子尺寸效应、库仑
期刊