真实感可视语音合成算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户：ckforme

【摘要】

：

可视语音的合成是近年来多媒体信号处理中的一个研究焦点和难点.随着智能人机交互应用的兴起,人们需要在交流过程中融合多种表达方式,多种行为模态以增加信息的含量,提高信息

【作者】

：

刘文韬

【机构】

：

北京工业大学

【出处】

：

北京工业大学

【发表日期】

：

2004年期

【关键词】

：

可视语音关键帧变形连读模型音视频映射隐马尔可夫模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

可视语音的合成是近年来多媒体信号处理中的一个研究焦点和难点.随着智能人机交互应用的兴起,人们需要在交流过程中融合多种表达方式,多种行为模态以增加信息的含量,提高信息描述的准确性.同时,在娱乐应用中需要提供一个声色兼备的界面以吸引用户,实现人性化的交互目的.该文在可视语音合成这个研究背景下,将工作重点放在可视语音合成中的真实感研究方面.首先,该文在音素层可视语音合成中采用关键帧核心技术,通过引入连读模型来提高关键帧口形合成中的真实感.通过引入渐变控制率使元音与辅音(V-C)关键帧之间的唇动更趋向于自然的唇动过程,该渐变控制率用非线性的幂函数来实现,幂函数所描述的变化过程与元音和辅音之间实际过渡相符.在引入渐变控制率的基础之上,通过对元音与辅音口形间相互影响的分级定量描述,针对汉语中连读影响最频繁最明显的元-辅-元(V-C-V)发音过程,该文提出了适用于关键帧技术的连读处理模型.由于该模型充分考虑了,光流对应在连读过程中的实际变化,因此该模型与图象关键帧变形技术相兼容.其次,该文在特征层可视语音合成中采用隐马尔可夫模型(HMM)作为基本的同步映射模型,用以描述底层语音特征与视觉口形之间的关联,通过双层HMM的框架来提高映射的准确性,从而提高合成结果的真实感.在基本的映射模型中,充分考虑语音上下文信息,将当前帧前一时刻和后一时刻的语音信息都作为模型的观察值.考虑到音视频对应中一对多的特性,对同一视觉类中的语音观察值进行视觉类内再聚类,从而得到多个语音观察子类,这些子类各自代表同一视觉类下的同一语音分布群体,通过它们得到的第二层模型包含在第一层模型下面,该文通过两层HMM的映射机制来实现底层语音特征与视觉口形之间关联的描述.

其他文献

基于小波变换的鲁棒性与脆弱性数字水印算法的研究与实现

随着计算机网络、多媒体及信息科学的不断发展，数字媒体的产权保护已成为一个迫切需要解决的问题。但是传统的信息安全技术只能控制信息传播过程，对信息失真原因判断的模糊性，对

学位

数字水印鲁棒性内容认证HVSPKI

Agent个体学习与多Agent协作的研究及其在RoboCup中的应用

近年来，有关多agent系统与分布式人工智能的研究，已经成为人工智能领域的重要研究方向之一。多agent系统以人类社会为参考目标，重点研究集体的智能行为。 RoboCup(robot worl

学位

RoboCup机器学习多agent协作神经网络协作图

数量关联规则算法研究和数据挖掘原型系统设计

作者的论文题目为"数量关联规则算法研究和数据挖掘原型系统设计",该文是对作者研究生期间所做研究工作的总结.随着关系数据库的迅速发展和成熟,特别是数据仓库技术的发展,相

学位

数量关联规则离散化聚类

基于统计模式的人脸识别

人脸识别是生物特征识别技术的一个主要方向,与其他生物特征相比,人脸识别具有主动、方便等许多优点.该领域的研究具有广泛的应用价值,可用于身份鉴别、信息安全、人机交互等

学位

人脸识别特征提取分类器设计径向基函数网络分类器

人工免疫算法及其在汽车图像分类中的研究与应用

近年来,人工免疫系统(Artificia1 Immune System,AIS)由于具有生物的智能行为己受到科学工作者的广泛关注,关于免疫算法的理论及应用研究成果也不断出现,但它在图像处理、模

学位

免疫系统否定选择算法多字段r连续位匹配规则Prewitt算子二进制特征编码有效检测集汽车图像识别和分类

量子彩色图像安全保护关键问题研究

随着量子计算理论及技术的不断发展，具有强大运算能力的量子计算机正逐渐成为现实。然而，在能够解决传统计算机所无法处理的难题的同时，量子计算机也对传统领域提出了新的要求和

学位

量子彩色图像安全保护图像处理置乱加密隐写几何变换

面向查询的GIS引擎的设计与实现

在我们的经济建设、日常生活中,80％的信息都是与地理信息相关的.在GIS应用中,高效的GIS引擎是应用系统的核心.该文首先介绍了在GIS引擎领域的重要理论和概念,阐述了GIS的数据

学位

GIS引擎栅格模型拓扑关系模型面向实体模型GIS空间索引空间矢量运算区域查询

基于主动网络技术的可靠组播协议

IP组播是发展潜力很大的网络应用,其可靠性是一个需要解决的难题.新兴的主动网络技术赋予网络以极大的灵活性,因而为提高很多网络应用(包括可靠组播)的性能提供了新思路.该文

学位

IP组播主动网络技术可靠组播差错控制协议拥塞控制协议

利用Web服务扩展CSCW应用的技术方法研究

人类社会是一个群体社会,特别是在当今信息化社会中,人们的生活和工作方式明显地具有群体性、交互性、分布性与协作性等特征.CSCW(计算机支持的协同工作)把"协同科学"与计算

学位

Web服务同步一致性群体感知CSCW

几何过程本体的构建及其应用研究

随着计算机技术的飞速发展,计算机辅助教育已成为信息时代的重要教育形式。但是教学系统中的教育资源缺乏统一的规范化表示,导致网络中存在许多相同或相似的资源而不能相互共

学位

平面几何过程本体自动解题

真实感可视语音合成算法研究

与本文相关的学术论文