【摘 要】
:
说话人性别和年龄识别是自然语言处理技术的一个子领域,是一项具有挑战性的任务,在人机交互系统中通过说话人性别和年龄特征识别,可以实现为特定对象提供个性化服务。随着人机交互系统的深入研究,用户体验的要求越来越高,该技术逐渐在自动语音查询信息、无人超市、健康护理、娱乐等领域得到广泛应用,并且有望在未来持续增长。针对语音信号特征提取和建模算法容易受环境噪声影响,性别和年龄识别准确率偏低,年龄识别易出现信息
论文部分内容阅读
说话人性别和年龄识别是自然语言处理技术的一个子领域,是一项具有挑战性的任务,在人机交互系统中通过说话人性别和年龄特征识别,可以实现为特定对象提供个性化服务。随着人机交互系统的深入研究,用户体验的要求越来越高,该技术逐渐在自动语音查询信息、无人超市、健康护理、娱乐等领域得到广泛应用,并且有望在未来持续增长。针对语音信号特征提取和建模算法容易受环境噪声影响,性别和年龄识别准确率偏低,年龄识别易出现信息缺失,不能完整表示说话人属性信息等问题,本文提出了语谱图特征结合Denese Net网络来进行与文本无关的说话人性别和年龄识别的研究思路,并完成以下主要工作:(1)提出一种新型语谱图特征生成算法,通过先分大帧再分小帧的方法增加语谱图生成数量,使得语谱图包含更全面的说话人信息,且通过算法提取语音信号背景噪声和无声段生成语谱图,作为系统特征输入图,经测试,以上算法在系统抗噪能力和准确性方面都得到了有效提升;(2)基于Denese Net网络结构构建了性别和年龄的语音识别算法模型,通过对激励函数和分类函数的优化匹配,改善了小数据集上存在的过拟合问题,深度网络梯度消失问题,加强了跨层深度卷积的效果,降低了对于特征图数量的需求,在节约系统计算资源的同时,很好的提高了系统识别率;(3)确定了语谱图帧长、学习率、网络结构参数、迭代次数等对系统识别率的影响规律,并完成参数的最优配置。基于以上研究结果完成了在线说话人识别系统设计,基于python3.10与Tensorfolw1.14.0实验平台,经采用不同语音库进行检验,说话人性别识别率总体达到了99%,年龄识别率总体达到88.6%,性别和年龄同时识别的准确率达到90%,单个说话人性别和年龄识别可在两秒内完成。
其他文献
随着社会经济和城市化的发展,高层建筑物、公路、桥梁、地铁等设施大量兴建;然而,在经济、社会发展中发挥重要作用的同时,引起不同程度的地面沉降,其危害的影响范围广,影响程度难以预计。因此,对城市地面形变监测具有重要意义。合成孔径雷达干涉测量技术具有全天时、全天候的等特点,能获取城市高精度地面形变信息。本文基于2016-01~2018-12的Sentinel-1A数据,采用PS-InSAR和SBAS-I
本文从生物、环境、社会和人文等学科相结合的角度,对中学生物教育中的四个意识,即生命意识、生态环保意识、动物保护与福利意识、科学伦理意识的现状进行调查与分析,旨在找到全面贯彻新时代生态文明思想、有效落实核心素养教育、全面提升中学生生物、环境、食品和安全等素质的切入口及实现途径。本次调查在抚州一中进行,主要采用的研究方法为问卷设置的调查法和数据处理的分析法。问卷的数据统计表明:(1)各年级受测学生中四
叙述视角是指作者在作品创作过程中对故事内容进行观察和讲述时采用的角度,根据叙述者观察故事的立场和聚焦点的不同而有所区别。法国学者热奈特则使用“聚焦”这个概念来解析不同的叙述视角,并将其分为“零聚焦”“内聚焦”和“外聚焦”三种类型。本文将运用叙述视角理论对鲁迅先生的小说《孔乙己》进行深入分析,在展示丰富社会生活内容的同时聚焦于人物复杂多变的精神世界,从而揭示深刻的悲剧性主题,表达出深沉的批判性力量,
近两年,机器学习,图像识别、5G通信以及人工智能等技术日新月异,在此背景下,增强现实技术受到研究者的普遍关注,与其它学科的融合使其迎来新的发展机遇。目前,关于增强现实,国内外研究主要集中在核心硬件、近眼显示、以及三维注册技术等方面,针对其实现方式的研究并不多,而且其存在着众所周知的问题即沉浸感较弱,普遍评价体验效果差等问题,更为自然的、支持多用户的实时的增强现实交互技术已然成为社会及研究领域中亟须
写作是高中英语教学的重要内容,然而现今的高中英语课堂,特别是写作教学,依然存在不少问题。教师在写作教学中仍习惯采用传统的教学方法,教师专门在花在写作课上的时间不多,更少有教师会注重向学生讲授写作的方法和技巧。而普通高中英语课程标准(2017年版)提出,教学的重要内容和提高学生学习能力的重要途径,就是要发展学生运用学习策略的能力。元认知策略可以帮助学生提高英语学习效率,监控和调整他们的学习过程,评价
重质碳酸钙作为用途最广的无机填料之一,广泛应用于橡胶、塑料等行业。当前,随着重钙下游延伸行业的高速发展,国内对重钙资源的需求日益增长。然而由于种种原因,国内对重钙矿产资源-方解石矿床的成因研究却相对滞后。浙西上方镇位于赣杭构造带东段,靠近扬子板块和华夏板块的构造缝合带,区内广泛分布着方解石矿床,是我国重要的重钙资源基地。前人曾对研究区开展了一系列地质勘查工作,但对区内方解石矿床成因的研究则相对较少
植被是陆地生态系统的关键组成部分。通过监测植被的时空变化不但能了解区域生态环境的优劣,还能反映气候以及人为因素对生态环境的影响。通过RS和GIS技术可以解决监测植被时空动态变化的问题,为抚河流域的生态环境以及生态文明建设提供一定科学的理论指导和技术支持。本文基于2000-2018年MODIS-NDVI时间序列数据、同期气候数据主要包括抚河流域10个气象站点的逐月温度、降水量数据、数字高程模型DEM
我国核安全是国家安全体系的基础和关键,高水平放射性废物的安全处置是核安全的重要组成部分。高放废物地质处置是国际社会公认的最为安全可行的方法。目前世界各国都在积极推进高放废物地质处置库的研发工作。处置库主要以“包容阻滞”为核心,以“多重屏障”手段,建设在地表以下500~1000 m深度的地质体中。因此,处置库场址的选择就至关重要。处置库场址的预选工作要从地质构造、水文条件、岩石力学、地下水理化性质以
发展核电是缓解能源问题的重要手段,包壳管作为核电站重要的安全屏障,不仅用于装核燃料芯块及传递热量,也是防止核反应中的裂变产物泄漏的重要包壳结构。锆合金作为燃料包壳,面临着反应堆内材料的辐照损伤的问题,故需要具有良好的综合机械性能,其组成成分有Sn、Fe、Ni和Cr等,合金元素Sn、Fe、Ni、Cr可提高材料的机械性能、耐蚀性和导热性,降低表面状态对腐蚀的敏感性,其中Sn和Fe占主体,本文以最主要的
西藏昌都盆地位于三江成矿带北段,沉积矿产资源极其丰富,对盆地开展沉积特征分析研究具有十分重要的实际意义。本文以昌都盆地古近纪沉积特征作为研究对象,综合前人研究成果,结合沉积学、岩石学及地球化学等理论知识对古近系贡觉组砂岩样品的粒度分布特征及地球化学特征进行分析,探讨昌都盆地古近纪的充填特征及沉积环境。主要取得以下认识与结论:(1)研究区主量元素地球化学特征显示:昌都盆地古近纪碎屑沉积物成分成熟度较