说话人识别中的多系统得分融合策略

来源 :第十届全国人机语音通讯学术会议 | 被引量 : 0次 | 上传用户:li5301251975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前说话人识别中采用多系统融合的策略来提高识别率,融合的策略主流的算法是采用线性逻辑回归的融合策略。这种融合策略是从每个系统得分的总体分布的情况来统一考虑,没有考虑每次测试中不同系统得分的置信度。在本文中,提出对每个系统的每次得分都作一次置信度的判决来决定融合的参数,然后采用线性回归的方法进行融合。在NIST SRE 2006的1训练语段-1测试语段的核心测试任务上,采用置信度的融合方案能够取得等错误率4.08[%]和最小检测代价函数0.0207。从实验的结果来看,采用置信度的融合算法优于线性逻辑回归的融合算法。
其他文献
音乐携带了大量的情感信息,音乐情感的识别已经成为人们关注的研究热点。对于它的研究在音乐数据库管理、音乐检索等方面有广阔的应用前景。本文提出了一种新的基于GMM的流行
信息咨询口语对话系统中的领域文法规则往往需要专家来人工设计。本文针对一种面向汉语口语的上下文无关增强文法,提出了一种基于句子分割的文法自动推导算法。其基本思想是:用
会议
目前 ,有相当部分妇女长期使用宫内节育器 (IUD)至绝经后仍未取出。随着绝经时间的延长 ,取出IUD的手术操作难度增大 ,若强行取器不仅会增加受术者的痛苦 ,而且容易出现并发症 ,本
区分性训练法方法是提高面向电话语音的语种识别系统性能的关键技术,基于GMM-SVM的系统是其中一种重要的识别系统。采用SVM方法在语种识别应用存在的主要问题包括:1)训练和测试
会议
送气辅音与非送气辅音是普通话辅音中的一对区别特征,在实际应用中需要寻找与之对应的特征参数。传统的M EL能量参数无法对这对特征进行有效的区别,该文在时频域使用W igner分布,提取基于W igner分布的特征参数作为送气辅音和非送气辅音的区别特征参数。经过一个较大语料库的测试,结果显示新的参数能够有效区别这2类不同的辅音,并且有较好的区分效果。
随着信息技术的快速发展,各种音频、视频数据日益增多,如何高效的定位关键信息具有十分重要的意义。本文主要基于关键词识别、文本分类等技术,设计并实现了一个针对汉语口语的语
会议
蒙古语中辅音的的送气与不送气的区别,向来解释为强弱之分,一般认为[p] [k] [t]等不送气音和[pp] [tp] [kp]等送气音的主要区别为前者气流弱后者气流强。而本文利用现代语音学
和弦的识别是音乐调式分析以及自动标注的基础,也对于音乐结构分析及旋律分析等任务有重要的作用,也因此成为音乐信息检索(MIR)领域的热点之一。本文根据音乐认知心理学原理,提
会议
本文论述了四川“512”大地震后公开报道的自杀个案、受灾人数和心理问题的发生率、应该重点关注的高危人群以及预防自杀的基本措施。
前言会展中心一般是面积较大的集办公、会议和展览于一体的专业会展服务中心,用于举办高规格、高品位的国家或国际级的大型科技文化类会议及各种展览。 Preface Convention