嵌入式语音合成系统的研究与实现

来源 :中国科学院自动化研究所 | 被引量 : 0次 | 上传用户:yl198710310318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机与网络的不断发展以及社会信息化程度的日益提高,人们对获取信息的手段和方式提出了越来越高的要求。作为人类最有效便捷的通信交互手段,自然的语音交互方式在人机通讯领域的地位日渐凸显。随着嵌入式技术的蓬勃发展,嵌入式设备同人们日常生活的联系变得越来越密切。这些嵌入式设备多以信息终端的形式出现,集计算、通信、传感功能于一身,能方便地与各种设备(包括日常用品)结合在一起。因此为了满足用户对于嵌入式设备更便捷、自然使用的需求,将语音合成技术应用到嵌入式设备中成了必然的趋势。   本文的研究工作如下:   同组内成员合作提出了一种基于韵律环境约束的基元选取算法。在拼接合成系统中,选取单元时除利用传统的上下文信息之外,还利用了候选单元的韵律环境信息。采用决策树的方法对单元的韵律环境进行建模,将预测出的韵律环境属性集成到基元选取的代价函数之中,提高了合成结果的连贯性和自然度。   提出了一种基于混合基元的音库构建方法,混合基元主要由声韵母及其组合对构成,其基本思想在于:在构造波形拼接所需的语料时,可以结合不同类型基本声学单元的优缺点,尽量在音库中保留对于协同发音影响较大的单元组合。   给出了一套完整的基于声学层面的音库量化压缩策略,在对原始音库充分分析的基础上,利用数据挖掘技术对原始音库进行合理适度的载剪,使得生成的目标音库尽量保持原始音库中的韵律特征,从而实现既大幅压缩了音库的规模,又较好地保持了合成结果的自然度和可懂度。   最后实现了一个达到实用化水平的中文嵌入式语音合成系统。制作出了适合不同嵌入式平台下的小型音库,使得合成系统在极小资源消耗的情况下,获得了清晰、自然的合成效果。在实现过程中,重点关注了系统的可载减性、可定制性和可移植性。合成系统可适用于多种嵌入式环境。
其他文献
本文以鲹科鱼类仿生研究对象,根据鱼类的身体结构特征、实际元器件和实现方法的约束,开发了一个可以对机器鱼机械参数进行自动优化的仿生机器鱼设计与仿真软件平台。文章对机器
数据挖掘是一门新兴的技术,它涉及到多个学科领域的知识。数据挖掘能从大量的数据中发现一些人们事先未知的、潜在的、有趣的知识,因此又被称为数据库中的知识发现。数据挖掘
学位
随机系统输出分布控制在实际的生产过程中有很多典型的应用对象,因此有必要对其进行研究。对于系统参数满足高斯分布的随机系统,可以通过控制系统输出的统计参数来实现对系统输
无线传感器网络(Wireless Sensor Network,WSN)是由大规模部署在监测区域内的节点自组织形成的多跳、无中心的无线网络,各节点具有物理感知、数据采集和数据传输能力,在监控和目
智能建筑是信息时代的产物,伴随着工业控制技术、通信技术和网络技术的发展以及社会信息化的需要应运而生的。信息共享在智能建筑管理系统中起着十分重要的作用。而由于传统的
巡线机器人能够沿输电线路爬行,利用携带的检测仪器代替人对杆塔、导线、绝缘子、线路金具等实施接近检查。这种作业方式,将大大减轻输电线路维护人员的劳动强度,提高巡检效率与
三维人脸重建(人脸建模)是多媒体领域一个极富挑战性的课题,人脸的三维模型在诸多领域都有应用,诸如电话会议、虚拟现实、动画与人脸识别、刑事鉴别等。为了逼真地重建三维入脸
原油蒸馏过程是炼油厂及大型石油化工企业的龙头。常压蒸馏是实现蒸馏过程的重要装置。常压塔四线350℃馏出含量是炼油厂常压蒸馏过程的重要质量指标,它与常压炉出口温度等多
随着机器人技术的成熟,越来越多类型的智能服务机器人融入到人类的日常生活中,行人目标识别和跟踪技术也逐渐成为机器人的关键技术。但是智能服务机器人在实际行人目标识别和