基于广义音素的文本无关说话人认证的研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:Vercetti
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
从二十世纪80年代开始,随着科技的发展,文本无关说话人认证作为模式识别领域类一个的分支,越来越受到研究人员的青睐。目前,最热门的文本无关说话人认证系统均是基于高斯混合模型并结合背景模型的,这类系统忽略说话人说话的内容、语言等,因而其工程应用价值大打折扣。为了弥补当前技术的不足,近两年,基于广义音素的说话人认证系统引起了学术界的关注。采用广义音素的说话人认证不仅可以结合语音识别技术、文本无关说话人认证技术,还可以引入商业应用中比较成功的文本相关说话人认证中的技术:另外,广义音素的说话人认证可以很好的解决由于说话人语言多样性而带来的问题。在课题中,作者从广义音素的定义开始,对基于广义音素的说话人认证系统作了深入研究。文中,作者提出了一套完善的广义音素定义及模型训练方法并设计了基于广义音素的说话人认证系统的整体框架,使系统的性能和流行的基于高斯混合模型并结合背景模型的系统性能相当;同时,为了提高音素识别前端处理以及说话人自适应的效率,作者分别提出了快速声道长度归一化算法和说话人自适应鲁棒性算法;除了对基于应马尔可夫模型的广义音素说话人认证作了大量的研究,作者还提出了以本征音说话人自适应训练因子来张成说话人空间并使用支撑向量机在该空间来做说话人认证判决的系统,该系统能对传统的系统判决起到很好的补充作用。
其他文献
摘要:城市规划建设是一定時期内城市发展的蓝图,是城市建设和管理的依据,是促进城市的发展、维护公共生活空间必要手段。现代城市规划工作涉及了经济、政治、文化等多方面的因素,是一项综合性、全局性和战略性的工作。目前,我国城市规划及建设工程管理中还存在较多的问题,本文对此进行了详细的分析,并提出了相应的对策。  关键词:城市规划;建设工程管理;问题;对策  Abstract: urban planning
期刊
摘要:山区小城镇建设和规划,是指对山区县镇和村乡镇的建设、规划。县镇是全县政治、经济与文化的中心,是全县人口最为集中的地方,所以一般把它归入城市系统。村乡建制的镇,是属乡村系统,是县以下一定区域内政治、经济、文化的中心。从我国城市整体来看,山区小城镇是城市之尾;但从山区这一区域来看,山区小城镇又是山区经济之首。尤其是县镇,它连着县镇以下众多的村乡镇,把它们作为自己的拱卫,以此来带动全县的经济的发展
期刊
近年来,为了满足行业用户高效的信息交互,无线专网的宽带化将成为发展的必然选择。LTE(Long Term Evolution)宽带专网系统正是以TD-LTE(Time Division-Long Term Evolution)
本论文的研究主要分为两部分:第一部分是大容量可扩展交换结构及其调度算法的研究;第二部分是以太网交换机的流量控制研究,结合公司项目,提出解决方案。随着互联网快速发展,
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种特殊的多载波传输方案,其优点是对抗频率选择性衰落,同时又提高了频谱利用率。它不仅仅可以增加系统容量
期刊
摘要:目前高层建筑浅层地基土地承载力很难满足要求,高层建筑大部分采用了钻孔灌注桩,泥浆护壁钻孔灌注桩在成孔过程中孔壁土体易出现松动,软化及孔底沉渣,这在很大程度上降低了桩的承载力。经过桩底注浆,通过渗透、劈裂和挤密作用使桩端持力层及桩身周围土体在一定范围内形成浆液和土的结石体,改善持力层的物理学性能,恢复和提高持力层土体强度,使桩的端承力得到较大幅度的提高,减小桩的沉降量。    关键词: 桩基工
期刊
H.264是由ITU-T和ISO/IEC联合成立的小组JVT提出的新的视频编码标准。该标准的主要目的是进一步提高压缩效率,并为视频信号提供一个适合网络传输的接口。无论从编码效率,还是
摘要:在我国较常见的建筑物形式为上部为小开间的民用住宅,较多的墙体来分隔空间以满足户型的需要;下部为大开间的商场或公共娱乐场所,大柱网、少墙体,以满足公共使用要求。为了实现这种结构形式的建筑物,必须在上下不同的结构体系转换的楼层设置转换层,完成结构变化形式的过渡。  关键词:高层建筑;转换层;设计特点;结构布置;构件设计;抗震设计  中图分类号:TU97文献标识码:A文章编号:  引言:  随着城
期刊
本文研究的是关于合成孔径雷达的欺骗干扰方法以及干扰效果评估方法。 首先介绍了合成孔径雷达成像的基本原理,合成孔径雷达是利用脉冲压缩技术获得高的距离向分辨力,利用合