语音识别中混合声音处理和垃圾文本筛选的研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:lin901102
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的语音识别系统基本上都是基于较为纯净的语音环境建立的,即在声音抓取的基础上,进行简单的滤波和去噪声,然后直接将声音信号输入到语音识别网络得到识别文本。一旦环境中有噪声干扰或存在其他人的声音,语音识别就会受到严重影响。已有的信号去噪、参数去噪和抗噪识别等方法都有一定的局限。如果能实现干扰、噪声和语音的自动分离,即在识别前就获得较为纯净的语音,就可以彻底解决噪声环境下的识别问题。近年来的声源分离等技术的飞速发展为干扰、噪声和语音的分离提供了可能。同时,在一次人机对话的过程中,机器人仅仅是通过执“问题文本”去搜索“应答文本”,然后把“应答文本”变成声音播放出来,机器人对其听到的“问题文本”并没有任何的分辨能力,经常发生机器人误响应的问题。针对这两个问题,本文提出了一种基于盲源分离和垃圾文本筛选的语音识别系统设计方法。首先,分别研究PCA和ICA这两种方法实现对混合声音流的盲源分离,测试盲源分离方法的使用对混合声音流识别的影响,并通过实验验证,得出盲源分离的加入可以在一定程度上改善语音识别系统对混合声音流识别效果的结论,同时对比发现ICA方法实现盲源分离的成功率可以达到96.4%,要高于PCA方法的89.6%成功率。研究三种文本筛选的实现方法,即基于规则的文本滤除、基于朴素贝叶斯的文本滤除和基于支持向量机的文本滤除,实验对比发现,文本筛选环节极大地降低语音识别系统对“垃圾文本”的误响应率,三种方法对“垃圾文本”的召回率分别可以达到92.4%、89%和98%。所以本文使用基于ICA方法实现声源分离,使用基于SVM方法实现文本筛选。声源分离可以将机器人听到的混合声音流分离成若干个纯净的声音流,使得语音识别系统能够对每个纯净声音流分别进行识别处理,避免了传统语音识别系统对混合声音识别率低所造成的误识别的问题;文本筛选可以判断每个纯净声音流对应的识别文本是否合格,对不值得回答的“垃圾文本”进行滤除,在一定程度上避免误响应的问题。基于盲源分离和文本滤除语音识别系统的工作流程是声音监听,声音抓取,声音滤噪,声源分离,语音识别,文本筛选,文本响应等七个环节。实验表明,相比于传统的语音识别系统,基于盲源分离和文本滤除语音识别系统对混合声音流的识别率有显著提高,同时对“垃圾文本”响应率有明显下降。
其他文献
3D打印技术是一种快速自由成形、制造三维实体零件或比例模型的技术,也称为增材制造(Additive Manufacturing,AM)技术。其中,熔融沉积成型(Fused Deposition Modeling,FDM)技术,因为成本低廉、原材料范围广、环境污染小以及后处理简单等优势,是目前应用最为广泛的3D打印技术。然而,材料逐层累加的制造工艺致使FDM零件存在很多诸如气孔、夹杂、裂纹、层间分离
ZnO是第三代宽禁带半导体的杰出代表,室温下的禁带宽度为3.37 eV,具有很高的激子束缚能60 meV,发光波长范围覆盖了从紫外到红外的整个区域,透光率可高达90%。同时,制备ZnO薄膜的原料来源丰富且价格低廉,生长温度相对较低,成膜的质量高,这些都使得ZnO在未来的光电领域中是一种优先考虑的材料。然而,要实现ZnO在光电领域的广泛应用,关键是通过掺杂的方式获得高质量的ZnO薄膜,并以此为基础制
灵长类仿生机器人的仿生悬臂运动控制是仿生控制领域极具挑战性的研究热点,具有非常重要的研究意义。本文利用深度强化学习算法,将深度神经网络模型作为机器人控制器,并在机器人仿真环境中对控制器进行训练。主要研究工作如下:针对灵长类仿生机器人的悬臂运动控制问题,设计了面向机器人悬臂运动的深度强化学习算法,并在机器人仿真环境中完成控制器的训练和控制效果的测试。深度强化学习是一种在未知环境中进行学习的算法,需要
石墨材料作为目前商业化最成熟的锂离子电池负极材料之一,仍然面临着理论容量较低(372 mAh/g)等问题。因此,寻找和发开新型的负极材料,仍是一项极有意义的研究。生物质具有来源广泛、成本低廉、绿色环保、可再生等优点,用其制备的碳材料已被广泛用于水处理、气体吸附、超级电容器等领域。另外,过渡金属氧化物作为锂离子电池负极材料,具有较高的理论比容量,但循环性能差。本文以此为思路,将生物质碳材料和金属氧化
本文选取Weldalite-049、2A97、1420三种典型铝锂合金作为研究对象,通过改进后的AAEC制备铸锭方法,结合金相显微镜、场发射电子探针、扫描电镜和拉伸试验等手段,研究了低频电磁场参数对半连续铸造铝锂合金锭坯组织及缺陷的影响;详细讨论了电磁场对Cu元素或Mg元素及Li元素的分布、宏观偏析行为及共晶相的影响;测试了加工后及T6、T8热处理后铸锭的力学性能;开拓了 AAEC(氩气保护-电磁
串联结构的工业机器人具有工作空间大、运动灵活等优点,在航空制造领域已经有广泛的应用。本文面向机械加工的应用需求,设计了一种新型三自由度机器人的机身和臂部,并为其配套设计了多款末端执行器,可使机器人在机械加工领域内完成以钻削为主的多功能作业。通过理论、仿真分析以及实验验证对机器人动态性能进行了研究。论文进行的研究工作具体如下:(1)根据机器人的功能要求以及具体工作参数对机器人的结构进行设计,并通过分
集装箱接驳运输作为集装箱陆路运输的主要部分,提供从港口到收货人或从发货人到港口的运输服务。与其他运输方式相比,接驳运输具有运输时间较短、成本相对较高等特点。集卡的到港时刻影响其在港口排队时间的长短,同时集卡在两个地理位置的行驶时间易发生改变,合理且稳定的集卡调度方案显得尤为重要。因此本文研究了考虑排队时间和不确定行驶时间的集装箱接驳运输问题,并使用鲁棒优化方法解决了不确定的接驳问题,主要研究内容如
随着科学技术的发展,切换广义系统被越来越多的应用在实际领域之中,自适应控制更是作为解决系统控制设计问题方法之一。切换系统的自适应控制已经得到了广泛的研究,并取得了丰硕的成果。切换广义系统是对于正常切换系统的进一步延伸,具有深刻的理论和现实意义.本文针对几类切换广义系统模型,基于Lyapunov稳定性的基本理论,线性矩阵不等式的基本理论,构造适当的Lyapunov函数等方法,对这几类切换广义系统的自
热冲压成形技术解决了高强度钢板冷成形困难、回弹大等问题,因此在汽车工业得到迅速发展和应用。Al-Si镀层能够有效避免钢板表面在加热过程中引起的脱碳和氧化,是目前应用最为广泛的热成形钢镀层技术。激光拼焊将不同强度、不同厚度的几个小零件焊接集成为一个大的毛坯,然后再冲压成所需整体部件,成为汽车轻量化、保证汽车安全、优化设计和改进制造技术的重要手段。对于带Al-Si镀层的热成形钢,激光拼焊时镀层金属尤其
碳化硼具有硬度高、耐磨性好、耐腐蚀性好和中子吸收能力强等诸多优点,被广泛用于军工防弹装甲材料、研磨材料、耐火材料、核屏蔽和控制材料等领域。目前,碳化硼粉末的工业化生产方法为碳热还原法,然而,此方法生产的碳化硼产出率和优品质率普遍较低且能耗高,产出率不到80%,优品质率不到40%,能耗更是高达2.9~3.0万度电每吨。因此,本论文的主要研究目的是在碳热还原法制备碳化硼过程中引入碳酸钠添加剂,以降低碳