说话人分割相关论文
随着互联网(Internet)的快速发展,一方面人们可以更容易从互联网上得到海量信息,人们的生活变得更方便;另一方面,互联网上也存在大......
随着信息技术和存储技术的发展,音频数据量呈现爆炸式的增长。面对如此海量数据,人们更加迫切的希望能够从中准确快速地搜索到需要的......
近年来,在生物特征识别领域,说话人识别以其独特的安全性、经济性和准确性等优势受到越来越多的关注,并逐渐成为人们生活和工作中......
本文所研究的说话人分割与聚类技术是语音识别领域中一个较为新兴的研究方向。该技术主要是针对含有多个说话人的对话型语音,例如含......
说话人分割与聚类(Speaker diarization)主要任务是在没有任何的先验知识的情况下,从一段录音资料中区分不同话者的说话区段,并且......
语者发现与跟踪技术作为说话人识别技术的应用之一,它解决的是在待处理的音频文件中的语者数目、语者身份、语音背景等都未知的情况......
该文的研究主要面向实时的电视新闻的说话人分割和追踪.该文在广泛的文献阅读基础上对此课题进行探讨,将此研究课题分成两大模块:......
目前,对音频信息进行自动分类和检索是语音信号处理领域的最新研究课题之一,而说话人分割(Speaker Segmentation)与说话人聚类(Spe......
Speaker diarization的作用在于:它作为语音识别技术的前端,在毫无先验概率的情况下区分语料中不同说话人,并用说话人说话的起止时间......
对传统的基于贝叶斯信息准则(BIC)的说话人分割方法进行了改进,通过引入预分割环节来降低说话人分割的计算量。理论分析和实验验证......
随着科技创新和网络技术不断深入发展,以往的身份验证已然无法为用户的信息安全和财产提供有力的保障,传统认证方式正逐渐被生物特......
新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、......
利用说话人信息自动管理海量混合语音是一个重要的研究课题,为了提高多人会话场景下短语音的说话人分割正确率,论文研究了一种基于......
为了提高说话人分割(SS)准确率,该文综合考虑了静音信息和性别信息在SS中的作用,提出了一种两步判决的SS算法。在从音频流中分离出......
随着媒体数字化技术和网络技术的发展,人们的日常生活中所接触到的数字视频越来越多。相应的,对数字视频进行分析和查找的需求也越......
重叠语音是影响说话人分割性能的主要因素之一。该文提出了基于语音高层信息特征的重叠语音检测方法以提高说话人分割效果。首先用......
说话人分割机制的主要任务是对含有多个说话人的音频信号进行自动分割,使得理想情况下,分割后的每个语音片段只包含一个说话人。说......
现代IT技术的发展越来越快,获取各类音频文档的方法也都相继出现,而数据量则呈现快速增长的趋势,管理音频文档将会越来越困难,因而对音......
提出一种基于稀疏神经网络的说话人分割方法,利用稀疏的单隐层神经网络提取语音的超矢量特征中说话人因子特征,然后通过K均值聚类......