面向陆空通话的说话人识别研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:sanshao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
陆空通话是民航空中交通管制员和飞行员之间进行交流的主要载体,对于飞行器的正常起降、紧急情况时地空间的沟通都有着重要的意义。依据统计数据,陆空通话错误引起的飞行安全事故占所有安全事故的41%,对陆空通话进行分析有助于避免出现飞行安全事故。为保障航空安全,缓解陆空通话分析工作中的人工负担,本文针对陆空通话语音特点,探索适用于陆空通话的说话人识别方法,从而为陆空通话的自动化与智能化分析奠定基础。为获得良好的陆空通话语音样本,本文首先探索了陆空通话场景下的端点检测方法,然后,针对陆空通话的短语音特点和复杂噪声的问题展开说话人识别方法的研究。主要工作及成果如下:1)设计了基于多特征融合和双门限估计的端点检测方法针对陆空通话音频中的噪声和短间隔特点,选用短时能量、短时过零率和谱熵三种语音特征进行融合获得融合特征,融合特征在复杂的噪声条件下可对语音和非语音的变化更加敏感;设计结合FINCH聚类的双门限值估计算法,能够根据陆空通话音频的融合特征样本集,自适应地估计高低门限值且时间复杂度低,从而使端点检测方法具有良好的泛化能力以及实时性;在此基础上,设计面向陆空通话的端点检测方法;并设计对比实验,结果表明基于多特征融合和双门限估计的端点检测方法能够快速且较准确地检测陆空通话语音的端点,从而为后续说话人识别研究提供良好的数据支持。2)构建了面向陆空通话短语音特点的说话人识别模型针对陆空通话的短语音特点,构建了端到端的说话人识别模型。端到端的设计,使陆空通话语音中蕴含的所有说话人信息都被模型接收;使用可学习的Sinc滤波器组进行特征提取,滤除对说话人识别无意义的语音特征;构建双重注意力机制,对语音特征进行增强并加强模型对关键语音特征的关注度;选用残差神经网络作为骨干网络,避免说话人信息在传递过程中丢失;设计多尺度卷积残差块,从多视角对特征进行挖掘;设计动态角度间隔损失函数,进一步提升模型的性能,解决样本数据不均衡的问题并改善模型的非凸优化问题;并设计对比实验,结果表明所构建的模型能够有效提高短语音说话人识别的准确率和等错误率。3)设计了基于语音增强的降噪和联合优化的陆空通话说话人识别方法针对陆空通话语音中的复杂噪声,构建基于深度解编码网络的语音增强模型,使用解码器消除噪声,使用编码器对语音重构,并利用跳跃连接保证在语音重构过程可有效恢复语音细节,缓解语音失真的问题;设计联合优化训练方法,在训练过程中将说话人识别损失函数与语音增强损失函数联合,实现语音增强模型和面向陆空通话短语音特点的说话人识别模型的联合优化;在此基础上,提出了陆空通话场景下说话人识别方法;并设计对比实验,在陆空通话数据集和公开数据集上对本文方法进行评估,结果表明本文方法在准确率和等错误率指标上均有良好表现,从而验证了该方法具有一定的实际应用价值和泛化性。
其他文献
信息的爆炸式增长促使了自然语言处理技术的发展,如何高效地从海量的文本数据中提取出有用的语义信息是目前研究的重点与难点问题。结合自然语言本身的特点,本文从序列标注和词义消歧两个方向展开研究并提出相应的改进方法,主要工作及研究内容如下:(1)研究基于序列标注的语义信息提取方法。传统的利用Bi LSTM的单词级序列标注方法通常忽略了字符中的语义信息,同时这种顺序处理输入序列的方式会限制捕捉句子内非连续单
学位
数字经济时代,数字化转型赋予企业新的发展动能,这能否提升企业的绿色创新能力?基于沪深A股上市公司2007~2021年的数据,实证检验企业数字化转型对绿色创新能力的影响及其作用机制。研究发现,企业数字化转型有助于提升绿色创新能力,经过一系列稳健性和内生性检验后结论依然成立。中介机制检验结果表明,企业数字化转型有利于提高资源配置效率、人力资本配置效率和创新资源配置效率,进而影响绿色创新能力。进一步研究
期刊
本文基于企业技术创新与人力资本结构视角,以2010—2021年制造业A股上市公司年报与财务数据为基础,利用Python分词处理与人工识别构建数字化词典,并以文本分析法构建了制造业数字化程度指标,实证分析了数字化转型对制造业服务化的影响。结果显示:(1)总体上,数字化转型对制造业服务化水平的提升具有显著促进效应,且该效应在采用“宽带中国”战略作为准自然实验和清朝城墙数据作为历史工具变量等一系列内生性
期刊
随着物联网技术的高速发展和相关设备的广泛使用,其安全性也因此受到了重视。其中,物联网设备中的固件安全就是很重要的一个方面。目前,在固件开发过程中存在大量使用开源库和代码复用的问题,导致不同平台上的固件经常受到相同已知漏洞的影响。因此,检测跨平台下的同源漏洞可以有效减少固件漏洞对设备造成的不良影响,这对维护固件安全具有十分重要的意义。现有的漏洞检测方法一般需要对所有的待检测函数进行精确匹配,导致在大
学位
建设工程的稳步发展离不开施工安全管理的保障,在安全管理工作中,对施工现场安全网的完好性进行动态检测是工地安全保障的基础。结合检测结果综合评价施工现场存在的风险,对安全管理工作有积极的推进作用。现有的施工安全网完好性检测主要依赖人工巡查,无法保证实时性,而且人力资源开销较大,还可能存在漏检问题。针对上述问题,本文研究利用深度学习方法实时检测安全网的完好性以及破损分类,并构建基于安全网完好性检测的施工
学位
本文旨在探讨数字化转型对企业经营管理的影响,并提出相应的实施策略和管理模式。通过文献综述和案例分析,对数字化转型的概念、特点以及对企业经营管理的影响进行了深入探讨,并分析了数字化转型的实践案例,总结了数字化转型的成功要素和经验。同时结合实践经验,提出了数字化转型的实施策略和管理模式。研究表明,数字化转型对企业经营管理产生了深刻影响,可以提高企业的生产效率和市场竞争力,但也带来了一系列挑战。
期刊
相比于其他传统人工神经网络的计算单元,通过对生物大脑中的神经系统信息进行模拟,脉冲神经网络所模拟的神经元在结构与其工作机制等各个方面更加具有仿生性,被誉为“第三代人工神经网络”。自脉冲神经网络理论首次提出以来,对其合理实现的研究和实践成为了一个热门课题,脉冲神经网络模型的实现方案主要分为软件模拟仿真和硬件电路实现两种思路,软件模拟具有易于开发、灵活性高的优点,但是脉冲神经元更加复杂,在模拟大规模网
学位
随着社交网络的迅速发展,每天产生数以百万计的短文本,其中包含兴趣、意图等各种有价值的用户相关信息。因此,短文本信息挖掘与分类具有重要的实际应用意义。然而,短文本具有特征稀疏、噪声高等特点,使得很多机器学习方法应用于短文本分类时出现性能下降问题,同时,许多神经网络模型在训练时依赖大量标记样本,但是现实中,获得大量标记数据十分困难。基于以上原因,小样本条件下的短文本分类成为自然语言处理领域的研究热点之
学位
大力推动数字化转型是建设制造强国的重大战略举措,数字化转型成为企业提升创新绩效的有效途径。基于动态能力视角,以2007—2021年沪、深A股上市公司为研究对象,运用Heckman两阶段模型与文本分析方法,实证检验企业数字化转型对创新绩效的影响及作用机制。实证结果显示:数字化转型显著影响企业的动态能力决策行为,企业的创新绩效也因此得到显著提升。异质性检验结果显示:数字化转型对创新绩效的提升在国有企业
期刊
随着信息技术的发展,监控设备的部署越来越多,为了构建智能安全的监控场景,对大量监控视频进行管理面临更多挑战,因此对监控视频进行智能异常事件检测的研究具有重要的现实意义。面向视频监控的异常事件检测具有一定的挑战性,不同场景中异常类型的多样性和异常定义的无界性,限制了监督学习在视频异常事件检测中的应用。自动编码器作为一种无监督的方法被用于视频异常事件检测中,但自动编码器较强的泛化能力导致正常帧和异常帧
学位