基于多示例学习的话者属性分类研究

来源 :江苏师范大学 | 被引量 : 0次 | 上传用户:lzxldf2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
话者属性分类是指计算机根据话者语音确定其性别与地域信息的过程。它在多语言信息处理、机器翻译、公安刑事侦查和军事情报搜集等领域有广泛的作用。多示例学习是解决模式多义性的一种有效的机器学习算法,它在图形检索、文本分类等静态模式分类中得到了广泛的应用,但在语音识别、话者识别等动态模式分类领域还缺少研究。本文重点研究多示例学习算法在语音性别识别和方言辨识中的应用。主要做了以下创新性工作:1.对汉语方言语音数据库进行扩展与标注。主要对北方方言、闽方言、湘方言、赣方言、吴方言、粤方言、客家方言七种汉语方言和普通话的电话语音数据库进行扩展。对每段语音标注说话人的相关信息,如性别、年龄、录制时间和所在城市。2.提出多示例时变模式学习算法。提出语音信号的包生成算法,把多示例学习算法运用到语音信号处理中,由于语音信号的连续性,人工把语音信号切割成时间相等的语音段,提取语音信号的声学特征,用K均值算法得到包中的示例。3.建立语音信号双点模型。本文提出双点模型代替单点模型,在尺度变换下,利用EM-DD算法分别求出不同类别的最大多密度点。4.设计了Bags-kNN分类器。在后端分类阶段,解决了集合与集合之间的距离测度问题,取代了传统的阈值判断,提高了分类器的性能。
其他文献
本论文采用低频力学谱仪研究了潮湿颗粒(细沙、玻璃珠)体系在剪切作用下的力学响应,进而探讨液体对颗粒体系结构的影响。实验主要测量了不同含水量下,细沙和玻璃珠两种颗粒体
学位
四棱锥结构的光学元件在四棱锥波前传感器、多色光探测器、光子晶体、多光束光摄、多光束激光干涉光刻技术、局域空心光束等方面都起着非常关键的作用。本论文针对四棱锥反射
学位
从分子层面认识活体细胞受辐射损伤过程时,生物小分子碎裂反应可能扮演着重要的作用,因此其碎裂动力学倍受关注。能量沉积是研究此类反应的一个重要但测量困难的物理量,CIDEC
学位
本论文采用从头计算分子动力学方法以及固有结构分析,研究了富含Te的液态Si-Te合金两种成分Si15Te85和Si20Te80以及过冷液态Si的微观原子结构和电子性质随温度的变化情况。主
学位
染料敏化太阳电池(DSCs)是一种新型的薄膜电池,它具有成本低、制备工艺简单等优点,且具有良好的开发前景,因此受到世界各国研究者的广泛关注。为了提高电池的效率和稳定性,目
学位
聚变装置中使用碳基材料会导致形成含有大量燃料的沉积层,因此,理解碳的输运和再沉积的过程对于ITER中氚滞留的预测至关重要。为此我们可以使用三维蒙特卡洛程序ERO,它主要模
学位
在线气溶胶添加基质系统,联合激光解吸附电离飞行时间质谱仪,构成快速在线的“软电离”质谱技术,非常适合环境大气气溶胶的大分子量物质(如生物气溶胶)化学组成的检测与分析
学位
电荷有序不但是材料中电荷、自旋、晶格强关联特性的集中体现,而且在此类材料中发现了第二类庞磁电阻效应(CMR),因此备受关注。而Bi3+离子具有独特极化的6s2孤对电子,能引起
学位
本论文论述了新型角分辨光电子能谱系统的研制,高质量欠掺杂范围内Bi2Sr2Ca1-xDyxCu2O8+δ单晶的生长,真空紫外激光角分辨光电子能谱仪对铜氧化物高温超导体Bi2Sr2Ca1Cu2O8+
学位
宏观量子效应是指在宏观体系中一些需要量子力学才能解释的效应,它们不仅是理论研究的热点,也有很重要的实际应用。本论文主要包括两个部分,一个部分关于分子磁体Mn12-Ac,另
学位