【摘 要】
:
说话人年龄分类是通过说话人的语音来估测说话人的年龄范围,属于说话人属性分析的重要内容。传统说话人年龄分类是利用人工提取特征加后端分类器的方法,这种方法不一定能够得
【机 构】
:
新疆大学信息科学与工程学院,新疆多语种信息术实验室,新疆多语种信息技术研究中心
【基金项目】
:
国家重点研发计划(2017YFB1402101),国家自然科学基金资助项目(61663044),国家自然科学基金资助项目(61761041)。
论文部分内容阅读
说话人年龄分类是通过说话人的语音来估测说话人的年龄范围,属于说话人属性分析的重要内容。传统说话人年龄分类是利用人工提取特征加后端分类器的方法,这种方法不一定能够得到最优的分类效果。针对该问题,利用深度神经网络自动获取特征表示的能力,提出一种基于深度神经网络的年龄分类方法,采用提取文本无关的说话人语音特征来通过深度神经网络对说话人年龄进行分类。在1000 h的AISHELL⁃2中文开源语音数据库上验证了所提出方法的有效性。与基于i⁃vector结合后端分类器的两阶段说话人年龄分类方法做了比较,实验结果证明,
其他文献
图书广告作为出版物营销的重要组成部分,在图书的前期宣传、促销、品牌推广等环节起着关键作用。以社会化媒体为主要传播渠道的网络广告,使作为广告主的图书出版方成为更专业
设计在Qsys系统上搭建硬件的最小系统,依据功能按模块进行设计与实现,并通过加入液晶IP核和外围电路实现用户交互。设置锁相环控制SDRAM芯片,实现系统内容的存取,最终将各个
为在全球范围开展水能资源评估,提高评估与规划的准确性与效率,通过建立水能资源评估的全球尺度参数标准、一般技术流程与方法体系,构建河流水能资源理论蕴藏量、技术可开发
党的十八大以来,在以习近平同志为核心的党中央坚强领导下,党和国家事业发生历史性变革、取得历史性成就,中国特色社会主义进入新时代。2017年10月,中国共产党第十九次全国代
针对传统方法的非线性系统模糊辨识精准度较低,且辨识速度较慢的问题,该文提出一种基于自适应粒子群算法的非线性系统模糊辨识方法。通过非线性系统模型原理,估计实质模型参
为研究桂林地区红黏土中化学成分Fe2O3、Al2O3、SiO2含量对其界限含水率的影响,分别采用蒸馏水和乙二胺四乙酸二钠(EDTA二钠)浸泡红黏土土样,对不同浸泡时间的土样进行化学成
本文以感知价值为核心理论,利用437份问卷调查结果,构建结构方程模型,研究大学生群体视频平台付费意愿。结果表明:大学生对视频网站的感知易用性对感知有用性和感知价值有显
为了提高高校微课评价自动审批系统响应速度,设计一种基于JBPM的高校微课评价自动审批系统。在系统硬件部分,设计了控制器、微处理器与存储器,为系统赋予系统控制功能、处理
针对大规模光储电站中出力波动大、跟踪电网调度指令精度差。提出一种新型自适应模糊神经网络的光储系统优化控制策略,将低通滤波和自适应模糊神经网络相结合,在跟踪调度指令
针对无刷直流电机在传统滑模控制中存在的抖振问题,在无刷直流电机调速系统中提出新型协同控制。该控制通过构造恰当的宏变量,不仅能够使宏变量以指数形式进行收敛从而保持良