基于半连续隐马尔可夫模型的文本无关说话人识别技术研究

来源 :北京大学 | 被引量 : 0次 | 上传用户:liandakj2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对基于半连续隐马尔可夫模型的文本无关说话人识别技术进行了研究。主要内容如下:   ⑴研究了处理信道噪声的相关技术。如倒谱均值减,方差归一化,以及特征规整和特征映射方法,并将特征规整和特征映射同时应用于前端处理,以提高系统的鲁棒性。 ⑵分析了主流的高斯混合模型为说话人建模的利弊,综合考虑训练数据量以及模型的描述能力,提出在目标模型.背景模型的框架下,以最大后验概率自适应的方式在通用的说话人无关半连续隐马模型上调整参数得到特定说话人的模型,并在此基础上对语音进行全音子解码以及强制对齐来计算语音在说话人模型上的得分。 ⑶实现了一个基于高斯混合模型为说话人建模的子系统以及一个基于半连续隐马模型为说话人建模的子系统,在NIST说话人评测数据库上,分别取得了12.3%和14.7%的等错误率。将两个子系统的结果在得分层次上融合,使系统性能进一步得到改善,等错误率达到11.4%。
其他文献
随着视频采集、存储和压缩编码技术的发展,数字视频数据的数量迅猛增长。目前,关于视频的应用已经从最初单纯的播放操作,发展到要求对视频内容进行访问和操作的更高层次,如视频索
本论文的主要研究内容为视频监控中的关键技术运动目标检测和跟踪算法及其在双核高性能数字信号处理器为核心的嵌入式平台上的优化实时实现,将优秀的视频监控算法和高性能数字
本论文针对无线传感器网络中可靠数据传输的问题进行了深入研究。无线传感网络中的可靠数据传输问题是受物理层,MAC层,网络层和传输层多方面影响的问题。可靠多段传输协议是一
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
苋属(Amaranthus)约40种,世界均有分布。我国有20种,分布很广,其中外来种为17种(11种为入侵种),危害旱田作物、果树、茶树和蔬菜。反枝苋(Amaranthus retroflexus L.)是苋属
本文通过对荣华二采区10
期刊
本文首先简要介绍了弥散张量成像(DTI)技术的原理,然后概述了传统STT跟踪算法的局限性及目前主要的改进算法,并在此基础上提出了本课题对传统算法的改进方向——采用边界停顿方
在传统的数字信号传输系统中纠错编码与调制部分是各自独立设计并实现的,译码与解调部分也是如此。随着今后家庭内部组网对高速数据传输要求的增加,势必需要在目前实现方式的基
小麦白粉病是由禾本科布氏白粉菌小麦专化型Blumeria graminis f.sp.tritici(Bgt)引起的气传性病害。在我国,自从上世纪80年代以来两次白粉病大流行后,小麦白粉病的发病面积
当今社会步入信息化时代,图像在信息传输过程中起到了举足轻重的作用,那么有关图像的处理技术在航空航天、生物医学、军方和通信领域就成为人类研究的重点。人们在研究过程中