在数据库中实现多媒体字段的直接查询--话者识别

来源 :山东工业大学 山东大学 | 被引量 : 0次 | 上传用户:shenxiaoxia123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文介绍了一种基于矢量量化技术的话者识别系统.用由线性预测分析获取的倒谱系数反映静态倒谱信息,用在时间窗内对静态倒谱进行最佳线性匹配获取动态倒谱信息.静态、动态倒谱可以相互补充,从而较充分地描述说话人声道模型特征.用求线性预测误差信号的归一化变形自相关函数的方法获取语音的基音周期,以反映说话人声带特征.应用矢量量化技术,对每个人的语音进行训练建立两个码书,即静态倒谱码书、动态倒谱码书.识别时,先用基音特征作初判,只有语音库中那些基音特征与测试语音的基音特征差的绝对值小于门限H1的说话人才能进入第二级判决.在第二级判决中,将两个倒谱特征的失真进行优化组合构成归一化联合失真进行判决.这里,为精确反映倒谱在矢量空间的分布情况,采用距离加权的欧氏距离.由于倒谱与基音分别描述了说话人声道及声带特征,两者的结合可以较全面地反映说话人特征.
其他文献
入侵检测系统是网络安全体系的一个重要组成部分。按检测方法可将入侵检测系统分为误用入侵检测系统和异常入侵检测系统。异常入侵检测系统具有可检测目前未知的新类型攻击的
该文扼要阐述了联机事务处理系统的基本概念及主要理论,包括DTP模型、交易的性质、联机事务处理系统的系统结构、交易中间件在联机事务处理系统中的作用.讨论了计算机系统灾
由于无线通信技术的迅速发展,对频率源的要求也在不断提高,希望做到频率稳定度和准确度高,而且能方便地改换频率.该文设计的X波段频率源应有在空间技术领域中,有可靠性高,体
体全息数据存储是一种基于页的光存储技术,由于它同时具有存储容量大、数据传输率快、存储时间短、能快速进行图像或图形匹配以及内容相关寻址操作的潜力,极有可能成为一种新型
该文对家用录像机(以松下NV-SD50型录像机为样机)中智能化技术体现之一的定时系统的组成及原理进行了分析,在已成功使用日本NEC公司生产的μPD75216A(4位)和日本三菱公司生产
IBM大型主机的通讯,主要使用的是SNA协议(System Network Architecture)及APPN协议(Advanced Peer to Peer network),从60年代起,随着IBM主机体系在商业领域的广泛使用,SNA体
目前实时系统在工业、商业和军事等领域有着非常广泛的用途,并且已经有很多实际的应用。随着计算机性能及网络技术的高速发展,大规模的实时应用(包括实时事务处理)已从以往的超级
该文首先从软件危机谈起,介绍了软件体系结构这门新兴学科的研究领域和目前该学科的进展情况,然后对一些常用的软件体系结构进行了分类.该文在给出关于对象和面向对象的基本
该文来源于深圳宇龙计算机通信科技有限公司软件部开发的PPS-HIGHSYSTEM系统.该系统以邮电部1996年颁布的《高速无线电寻呼系统联网协议》为标准,遵从邮电部《高速无线电寻呼
COSIX是一个国产UNIX操作系统.为了使之得到普及并方便广大用户学习和使用COSIX系统管理,迫切需要一个能实现COSIX主要系统管理工作的易于操作的软件.为此,研究人员承担了国