【摘 要】
:
近年来,随着智能设备越来越多地融入日常生活,语音合成被广泛应用到各种场景中,凭借人工智能技术和计算机技术的发展,语音合成系统的效果逐渐提高,但现有的语音合成系统合成的语音与生动活泼、感情丰富多彩的人类语言在语音的自然度、可懂度方面还有相当大的差距,并且现有的语音合成算法结构复杂,极大的限制了自身应用场景。因此在人机交互领域,语音合成技术的研究是一个重要课题。论文围绕着端到端的语音合成方法,针对语音
论文部分内容阅读
近年来,随着智能设备越来越多地融入日常生活,语音合成被广泛应用到各种场景中,凭借人工智能技术和计算机技术的发展,语音合成系统的效果逐渐提高,但现有的语音合成系统合成的语音与生动活泼、感情丰富多彩的人类语言在语音的自然度、可懂度方面还有相当大的差距,并且现有的语音合成算法结构复杂,极大的限制了自身应用场景。因此在人机交互领域,语音合成技术的研究是一个重要课题。论文围绕着端到端的语音合成方法,针对语音合成任务中,现有算法生成的语音自然度不佳以及声码器结构复杂问题,从对语音合成声码器优化方面开展研究工作。论文主要的研究内容如下:首先,论文阐述并分析了中文语音合成领域中的基础理论,其中包括汉语语音的特性、几种较为主流的语音合成算法及其相关原理,并介绍了几种评价合成语音质量的常用指标和评价方法。然后,针对中文语音合成算法中语音韵律欠佳和自然度不高的问题,利用BoTNet网络对WaveNet声码器进行改进。BoTNet网络中含有自我注意力机制,能够基于内容的寻址机制来实现成对数据之间的交互,达到对长跨度序列的复杂关联特征层次进行学习的目的,增强了对长跨度依赖信息的建模能力,从而提升了中文语音合成系统的性能。并且提出的B-WaveNet声码器算法减少了模型的参数量,加快了计算速度。仿真实验结果和语音听音测试均验证了该声码器的有效性。最后,针对语音合成算法中时域语音合成器的复杂度过高问题,提出了一个基于子带的语音合成器模型。该模型首先采用多级小波分解与合并,在时域上将信号分解或重构为子带信号,然后利用语音字典以语言学特征作为条件特征,实现了基于子带的语音合成器。利用子带信号带宽小的优点,达到降低时域语音合成器复杂度的目的。仿真实验结果和语音听音测试均验证了该声码器的有效性。
其他文献
汽车产业的快速发展在给人们生活带来便利的同时也带来了许多的交通安全问题,研究无人驾驶技术既符合当下智能时代的发展趋势,也是帮助解决道路交通安全问题的重要手段。对于无人驾驶车辆而言,环境感知和路径规划是非常重要的两个方面,其在保证车辆行驶安全方面起到了不可或缺的作用。中国汽车工程学会举办的大学生无人驾驶方程式大赛为高校在校生研究无人驾驶技术提供了广泛且专业的平台。论文依托于国家自然基金项目(5167
随着科学技术的进步,人工智能技术得到人们越来越广泛的关注,在研究人工智能的过程中,出现了很多杰出的科研成果,深度神经网络就是其中之一。深度神经网络优秀的特征提取性能使得众多研究者尝试将它融入到传统的图像处理算法中,并使得计算机视觉技术得到了长足的发展。由此,计算机视觉技术的应用范围越来越广,智能汽车就是一个重要的应用方向。针对当前智能汽车的行人目标视觉感知性能较低的问题,提出了一种基于深度学习的融
随着我国城市现代化建设脚步的不断迈进,人民对于各类建筑需求的越来越多,钢结构因其延性好、塑变形能力强、自重轻等优点被越来越多的应用到城市现代化的建设中来,充分满足了我国的住宅产业化和持续发展的要求。钢结构在人们的日常生活中不仅会受到各种常规荷载的作用,还会受到偶然引起的爆炸荷载的作用。在我国,爆炸主要是由意外爆炸事件引起的,这往往会造成巨大的财产损失,并且使人民生命受到危害。钢结构及其钢结构构件在
汽车的悬架系统是汽车的重要组成部分,传统的被动悬架逐渐无法满足汽车性能的要求,相比之下汽车的主动悬架在性能方面就有很大的优势。一款效果良好的悬架系统可以改善汽车的舒适性,对安全性也起到了非常重要的作用。随着人们对汽车的要求越来越高,同时对悬架性能也相应变得更高,因此对主动悬架的控制方法和控制结构的研究具有重要的理论价值和社会效益。在调查和研究了国内外车辆液压主动悬架发展现状的基础上,针对四分之一车
随着《中国制造2025》战略的逐步落实,国内制造业的发展越来越趋向于信息化与智能化,在药芯焊丝生产车间如何实现对拉丝机生产线设备的优化管理是该行业转型升级过程中急需解决的问题。目前,药芯焊丝生产车间虽然实现了生产过程的自动化,但是车间信息化建设仍处在较低水平,生产过程中的关键信息采集、产品信息记录、设备运行调度等均依靠人工完成。因此设计开发出一套拉丝机生产线设备管理系统对药芯焊丝生产行业的进一步发
随着现代工业进程不断的发展,大量含有铅离子(II)的废水排放到环境中,不仅影响了水中动植物的生存环境,而且威胁着人类的健康,造成极大危害。吸附法因为成本相对较低,操作简单,是处理水中重金属离子的常用方法。MCM-41分子筛是一种介孔二氧化硅材料,具有比表面积大,孔道结构规则,优良的化学稳定性及热稳定性等优点。因此,MCM-41介孔分子筛可以作为吸附水中Pb2+的吸附剂,但是纯硅MCM-41对水中的
“中国制造2025”战略的提出对我国产品的生产质量提出了越来越高的要求,计算机视觉理论的诞生为产品的尺寸检测开辟出一条创新型道路。在工业生产检测目标的过程中,外界的光强或者目标物体本身的属性会造成所采集到的图像存在全局或者局部低对比度的现象,致使无法精确地检测出物体的轮廓和特征点。针对这一现象,开展基于双目视觉低对比度三维几何参数测量方法的研究,主要完成以下几方面的工作:首先,介绍双目视觉研究的背
装配式建筑即构件通过工厂生产预制、运输和现场组装以实现快速建造的一种环保、绿色的建造模式。装配式建筑是建筑工业化的发展方向。根据绿色、节能、发展的理念,装配式建筑是房地产及建筑企业发展市场细分和提升竞争力的必由之路,这一选择也是实施第十九届中国共产党全国代表大会赢得“蓝天防卫战争”的重要一步。我国的预制建筑物的成本高于常规浇筑式建筑物,其中利润是企业发展的血液和生命线。在此阶段,成本过高是限制预制
随着定位技术的快速发展,室外定位导航系统的应用需求已经无法满足人们的生活所需,所以室内定位系统成为基于位置信息服务的重要研究对象。在室内定位中Wi Fi技术、蓝牙技术、基于惯性传感器的行人航迹推算定位技术、超宽带定位技术等都是室内定位的关键技术,Wi Fi网络已经实现大面积覆盖,具有传输距离远,组网简单,可变动性强等优点。蓝牙信标具有便于部署,功耗相对较低。因此,利用Wi Fi技术和蓝牙技术应用到
在互联网、智能移动设备、基于位置的服务软件、GPS服务的高速发展的背景下以及人们对基于位置服务的需求,进而产生了大量的基于位置的行动数据。这些基于时空轨迹的数据也极大的推动了社交网络的发展。有效的利用和挖掘这些时空数据内蕴含的信息是现实生活中亟需解决的问题,这能在现实生活中给企业带来巨大的利润,而且也能给用户增加个性化的服务体验,增加用户使用软件的粘稠度。而且在对移动行为建模和行为预测问题等问题上