【摘 要】
:
针对神经网络语音增强算法因特征选取不能全面表示语音非线性结构导致语音质量较差的问题,提出一种动态特征联合新掩模优化神经网络语音增强的方法。首先,提取带噪语音的3种特征并进行拼接以得到静态特征,后求一阶、二阶差分导数,捕捉语音的瞬息信号,融合成动态特征,动静结合完成特征内部互补,减少语音失真。其次,为了使增强语音的可懂度和清晰度同时达到最好,提出一种新的自适应掩模,它既能自适应调整语音、噪声的能量比例,又能自适应调节传统掩模和平方根掩模的比例;并用Gammatone通道权重修改每个通道内的掩模值,模仿人类听
【机 构】
:
太原理工大学信息与计算机学院,中国联通山西省分公司网络优化中心
【基金项目】
:
国家自然科学基金(12004275),山西省留学回国人员科技活动择优资助(20200017),Research Project Supported by Shanxi Scholarship Council of China(2020042)。
论文部分内容阅读
针对神经网络语音增强算法因特征选取不能全面表示语音非线性结构导致语音质量较差的问题,提出一种动态特征联合新掩模优化神经网络语音增强的方法。首先,提取带噪语音的3种特征并进行拼接以得到静态特征,后求一阶、二阶差分导数,捕捉语音的瞬息信号,融合成动态特征,动静结合完成特征内部互补,减少语音失真。其次,为了使增强语音的可懂度和清晰度同时达到最好,提出一种新的自适应掩模,它既能自适应调整语音、噪声的能量比例,又能自适应调节传统掩模和平方根掩模的比例;并用Gammatone通道权重修改每个通道内的掩模值,模仿人类听
其他文献
对于目标检测任务,深度神经网络模型中的一阶段网络结构存在两个问题。首先,网络结构中的锚框超参数设计的合适与否将影响整个网络的训练结果;其次,较大的降采样因子会影响目标的定位能力。针对这两个问题,提出了多尺度定位提升网络模型。重新设计了一阶段网络模型结构,并且提出了更好的锚框超参数选择方案,它在保证一阶段网络效率的同时,定位精度比之前的一阶段网络模型更好。大量实验表明,多尺度定位提升算法在保证实时性
针对传统多目标粒子群算法容易早熟的问题,提出了一种基于多样性控制的多目标粒子群算法。该算法采用一种基于权值向量的多样性评价指标来度量算法在每一次迭代时的种群多样性,并根据评估值来自适应地控制算法的进化过程。为了保证种群的多样性,采用一种基于Steffensen方法的自适应变异策略对外部种群进行更新。通过自适应地选择粒子的全局最优位置来实现种群多样性与收敛性之间的平衡。将该算法与几种常用的多目标进化算法在一系列标准测试函数上进行了仿真实验,统计结果证明了所提算法的有效性。
为了提高闪存存储的可靠性,利用置换来表示闪存单元电荷大小的等级调制方案。基于置换群理论的纠错码可纠正采用等级调制方案存储引发的多种特殊错误类型。当闪存单元被破坏而无法正确读出存储电荷值时,可能导致相应位置发生擦除错误或删除错误。针对闪存单元等级调制下置换码发生突发擦除错误的稳定性问题,基于纠正单个删除错误的LEVENSHTEIN置换码的构造方法,结合置换交织技术,提出了一种新的置换码构造方法,可分别纠正单个稳定的突发擦除错误和单个非稳定的突发擦除错误,并给出了两种错误相应的译码方法。通过实例验证了构造方法
由于全球卫星通信系统信道完全开放、天地一体化组网等,导致其通信安全保障面临严峻挑战。而物理层内生的安全机制能够保障卫星通信安全,有效地防止信道窃听。结合天地一体化组网,构建了同时存在地面窃听基站和窃听卫星场景的卫星通信系统安全性能分析框架。基于瑞利衰落信道和Shadowed-Rician衰落信道,分别建立了两类窃听者的窃听模型;考虑窃听者采用不共谋策略和共谋策略,分别推导出了两种窃听策略下该系统的平均安全容量和安全中断概率的解析表达式,以评估系统的物理层安全性能。仿真结果表明,提高发射功率能够保证在安全中
面瘫是一种以面部表情肌群运动功能障碍为主要特征的疾病。利用人工智能技术进行面瘫分级的辅助诊断不仅能够提高诊断的效率,且能够降低诊断结果受主观医疗经验的影响,提高诊断的准确性。而现有的基于计算机视觉的面瘫辅助诊断评估方法或模型主要存在以下3个问题:(1)从静态面部图像中提取的面部非对称特征难以准确表达面部运动的非对称特征;(2)浅层机器学习模型难以准确提取有效的面部特征信息;(3)深度神经网络模型难
针对高维多目标优化问题复杂度高,求解难度大的特点,提出了一种集成适应度排序的高维多目标粒子群优化算法。该算法通过获取种群中个体与参考点最近的向量,结合基于惩罚的边界交叉方法对种群中的个体进行排序,并对较差的个体进行删除,留下的精英个体被保存到外部档案中。将该算法与性能先进的4种高维多目标进化优化算法在13个标准测试实例的5,8,10,15目标上进行实验对比,结果表明,提出的算法在大多数测试用例上的性能表现优于对比算法,同时说明了该算法具有较好的收敛性与多样性,能够有效地处理高维多目标优化问题。
由于现有的大多数跨模态哈希方法未能有效地探究不同模态数据之间的相关性以及多样性,导致检索性能不尽如人意。为了克服该问题,提出一种简单而有效的深度跨模态哈希方法——深度共性保持哈希,可以在简单的端到端网络中同时学到模态共享表示和模态私有表示,并生成对应模态的判别性紧凑哈希码。与现有的基于深度的跨模态哈希方法相比,所提出的方法的模型复杂度和计算量几乎可以忽略不计,但是获得了显著的性能提升。在三个跨模态数据集上的大量实验结果表明,该方法优于其他当前最先进的跨模态哈希方法。
网络流量的加密传输是互联网的发展趋势之一,而加密流量中的恶意流量识别是维护网络空间安全的重要手段。识别恶意流量需要将加密流量进行密/非密、应用程序以及加密算法的细粒度区分以提高识别效率,再将不同精细度区分后的流量经过预处理后转化为图像、矩阵和N-gram等形式导入机器学习训练模型中进行训练,实现良性/恶意流量的二分类以及多分类。基于机器学习的识别效果严重依赖于样本数量和质量,同时无法有效地应对整形和混淆后的流量,而基于密码学的恶意流量识别技术通过深度融合可搜索加密技术、流量审查机制和可证明安全模型,在加密
针对当前位置隐私保护方案安全和效率问题,提出一种面向移动终端的K匿名位置隐私保护方案。首先在匿名区域选取2K个合理假位置,然后根据位置熵,从中筛选出K-1个较优位置,进而达到更优匿名效果;采用安全高效的不经意传输协议,避开了传统方案对可信匿名中心的依赖,提高了方案效率;同时可实现一次查询多个兴趣点的需求。安全分析表明,该方案满足匿名性,抗重放攻击和不可伪造性等安全特性。仿真结果显示,该方案具有更高的执行效率和隐私度,并具有较低的通信开销。
针对用户差异化的需求及融合网络局部过载造成视频业务中断的问题,提出一种负载均衡的视频传输机制。首先根据光纤无线接入网络的前端结构特点来改进分裂多径路由协议以获得路径选取模型;其次计算视频在无线侧的延迟和路径差分延迟,并确定其阈值作为用户体验质量约束;最后在考虑用户体验质量的同时,采用多级惩罚函数的粒子群优化算法进行视频分发。仿真结果表明,所提机制性能优于吞吐能力感知负载分发、增强延迟控制负载分发以及延迟-能量-质量感知的多路径算法,在避免用户流失的同时,能够有效地使网络负载保持均衡,缓解网络拥塞现象。