基于嵌入式平台的文本相关说话人确认算法的研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:pingli_lp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别技术以其方便、经济、易于被接受以及安全可靠等特点日益成为人们生活和工作中重要且普及的用户身份验证方式。但是,在嵌入式平台上使用常规的方法难以达到实时处理的要求。对于基于动态时间弯折(Dynamic Time Warping,DTW)算法的文本相关说话人识别系统来说,在普通PC机器上很容易达到实时的效果,但将其移植到嵌入式平台,如多普达掌上电脑P800(CPU主频为201MHz)时,训练和识别速度就会很慢,难以满足实时性要求。目前,国内外针对嵌入式文本相关的说话人识别实现的研究,鲜有与运算速度相关的。   本文针对这一现状,为了使文本相关说话人识别系统在嵌入式平台上得以实用,借鉴了语音识别中的非线性分段(Non-Linear Partition,NLP)思想,把语音按照内容划分为N段,分别对每段语音建立说话人模型。在对说话人识别主流的建模方式高斯混合模型(Gaussian Mixture Model,GMM)和通用背景模型-高斯混合模型(Universal BackgroundModel-Gaussian Mixture Model,GMM-UBM)的方法进行比较和分析后,根据训练数据较短的特点以及实际使用的特殊环境,最终采用单高斯模型作为说话人模型。单高斯模型简单的特点同时也决定着它不能够精确的刻画说话人的个性特征。因此,系统采用多遍训练进行模型融合,并针对文本相关的说话人识别语料选择合适的分段准则。除此之外,系统还使用双模型距离判决手段提高系统性能。   在同一个语料库上测试得到的实验结果表明:基于非线性分段算法的系统等错误率为1.21%,与基于DTW的基线系统相比,相对性能提高了57%,并且系统的训练时间降低到基线系统的23%,识别时间降低到50%,在实时性和实用性上均有着良好的效果。
其他文献
随着视频监控技术的发展,人脸检测和识别因其在罪犯识别、安防系统等方面的巨大应用前景而成为当前模式识别和人工智能领域的一个研究热点。但如果摄像头采集到的人脸图像的
随着工业过程朝着智能化、大规模和集成化方向发展,生产过程变的越来越复杂。复杂系统容易受到外部环境的干扰和自身设备的老化而发生各种故障,要实现工业过程自动化来提高生
当前随着经济的发展,能源消耗越来越大。能源问题成为制约我国经济发展的重要因素,建设节约型社会成为我国经济和社会发展的一项战略任务。在满足正常的工作学习条件下,如何
学位
随着交流调速技术的发展,永磁同步电动机(PMSM)已经得到了广泛的发展和应用。尤其是在可靠性和控制精度要求较高的场合,例如国家安全防御系统、航空航天工业、数控机床加工、
学位
随着科技的进步,仪器系统与计算机软件技术紧密结合,产生了虚拟仪器,虚拟仪器依托计算机强大的软硬件资源,从根本上更新了测量仪器的概念。另一方面,频谱分析作为近代的信号
学位
图文喷墨打印机控制系统中,卷纸的张力过大、过小影响产品的打印质量,降低工作效率。新一代图文喷墨打印机,要求实现40m/min,直径为360mm~420mm的大型卷纸打印,对打印机控制
能源问题已经越来越成为制约我国经济发展的首要因素,国家在节约能源方面出台了相关法规,《中华人民共和国节约能源法》已经正式实施。建筑业一直以来都是我国高耗能的行业之一
交通信号控制技术是交通管理领域的一个备受关注的前沿课题,在车辆管理、交通监控、智能公交等方面具有广阔的应用前景。近年来随着计算机技术的迅速发展,经过各国研究人员的
随着环境污染的日益严重和能源的紧缺,风能作为可再生的绿色能源越来越为人们所重视,也成为各国学者竞相研究的热点,研究风力发电技术对推动我国风力发电事业的不断发展和进
自由活塞能量转换器是近年来正在研究的一种新型发动机,它是未来混合动力汽车的一个潜在的动力技术。   在自由活塞能量转换器中,活塞没有与之相连的连杆机构。与传统的发动