Improving PLDA Speaker Verification Using Unlabeled In-domain Data: Towards Speaker Verification on

来源 :2015中国计算机网络安全年会 | 被引量 : 0次 | 上传用户:vuittonwang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  As the information security on network is being widely concerned,automatic speaker recognition technology could be used to find terror speeches containing some specific speakers.In this paper,we propose an unsupervised approach to improve the performance of an existing NIST-SRE-domain i-vector/PLDA system for the internet speaker verification application with a set of non-speaker-label audios collected from the internet.A speaker factor vector in i-vector space is extracted for each audio with the existing background models.Then a SVM classifier is applied on these speaker factor vectors to do speaker recognition.Speaker factor vectors of those given unlabeled in-domain data are used as the negative samples to train speaker-dependent SVM models.Experiments are conducted on NIST SRE 2010 condition-1,condition-2 task and an internet test-set.Results on the internet test-set shows that the propose approach achieves a relative performance improvement of about 50%in both EER and minDCF over the baseline i-vector/PLDA system.
其他文献
随着各类大型气田的开发建设,在处理量大、压力高、酸性介质含量高及系统复杂的天然气工程设计中,泄放系统设置问题愈突出,而国内相关标准规范对集输、长输管道工程泄放系统均未作详细要求,造成放空火炬系统设置不统一。为了提高对含硫天然气站场放空火炬系统的认知,通过对某放空火炬实例的现状分析,指出高含硫天然气放空应引入放空火炬系统燃烧后排放,并应具有可靠的全自动电点火设施,提出了为确保放空火炬系统安全可靠运行
Malware is defined as any type of computer software harmful to computers or networks,which has been posing a serious threat to the global security.Whats more,the amount of malware is increasing rapidl
近年来,随着社交网络的快速发展,社交网站已成为僵尸网络隐匿和攻击的理想平台.僵尸网络通过含有控制指令或恶意程序的异常页面来传播和控制僵尸主机,使得传统的僵尸网络检测技术的效果大打折扣.因此如何检测出含有异常文本的页面是社交僵尸网络检测面临的一项重要问题.本文将机器学习算法应用于社交网页的检测中,对页面进行异常特征提取,并在样本集上进行了实验.实验表明机器学习算法能够有效检测异常页面,提高检测效率.
随着互联网技术的发展,网络的应用也得到更好的普及,而保障网络安全成为亟待解决的问题.目前,木马是网络安全最严重的威胁之一,主要的检测方法是基于特征码的木马检测和基于行为的木马检测.论文从远程控制类型木马通信的三个阶段分析其流量行为特征,分析发现木马在建立连接阶段会有动态DNS行为,并且在数据传输时报文会置PSH标志位为1,导致PSH报文数量增大,以及在命令交互阶段上下行流量不对称、小数据包比例大和
网络地址空间随机转换技术通过分配虚拟IP、改变发送端和接收端主机的IP地址致力于构建一种动态、异构的网络,其目的是增加系统随机性并减少可预见性,以此增加攻击者攻击难度来对抗同类攻击.本文利用了新型网络架构OpenFlow具有的数据平面控制平面分离、集中控制以及传输规则动态更新等特性,将网络地址空间随机转换技术与OpenFlow网络技术相结合,在Floodlight控制器上设计了一种新型的改变IP的
Declassification and endorsement can efficiently improve the usability of mobile applications,some declassify and endorse operations in practice,however,are often ad-hoc and nondeterministic,as a resu
网盘作为一种流行的资源传播方式,其所分享的资源已经在网络流量中占有越来越多的比例,因此获取网盘资源的分享链接对于网络安全有着重要的意义.为此本文提出了一种基于Cookie的分享链接获取方法—CookieTracking.该方法首先建立cookie和HTTP会话的索引.其次,通过location哈希表和token哈希表获取了下载网盘资源的URL跳转链.最后,通过URL跳转链上的每个节点的统计分析获取
针对UDP上未知服务的发现这一挑战,网络管理员通常只能做到UDP服务分类,而要具体确定UDP上的未知服务,则首先需要对流量中的服务端进行确定.由于UDP无连接的特点,使得服务端的确定变得十分困难.本文提出了一种基于离线流量统计信息的方法试图解决这一挑战,并进行了相关实验.结果表明,该方法可在很多场景下有效确定UDP流量中的服务端.
针对网络流量特性随时间推移发生改变而引起训练样本变化(即概念漂移),从而导致基于机器学习的流量分类方法精度明显降低问题,本文提出一种基于协同策略的流量分类方法,该方法借助K-S检验对流量概念漂移进行检测,然后通过协同策略引入新的流量样本使分类器得到有效更新,应对流量概念漂移,最后根据集成学习策略综合分类结果.实验结果表明该方法在处理流量概念漂移上具有较好的分类性能和泛化能力,模型建立和分类效率表明
在传统语种识别中,特征研究的目标在于提取各个语种间的语言鉴别性信息.但在安全领域应用中,常常只对某一特定语种感兴趣,这就要求特征能够最大限度的体现目标语种与其他语种间的差异.为了解决这个问题,本文对在语种识别任务中取得优秀性能的对数域音素后验概率特征进行优化,来提高目标语种检出任务的性能.应用F比方法来分析特征向量每一维对目标语种检出的贡献大小.在本文方法中,首先利用音素识别器来估计帧级的音素后验