汉语语音视觉合成研究数据库CVSS1.0

来源 :微计算机应用 | 被引量 : 0次 | 上传用户:sunna2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前现有的双模态语音数据库多为外文,且绝大部分都是为语音识别或身份认证服务的。鉴于此,我们根据汉语语音的特点,建立了国内第一个较为完备的汉语语音视觉合成数据库CVSS1.0。它具有如下特点:包含136个单音节和265个连续发音语句的视频和音频数据,其语料规模超出目前同类数据库;语料是在汉语发音方式归类的基础上,依据汉字出现频度的高低选取,其中的独白语句涵盖了大部分的韵律结构,因此其反映的规律具有代表性;记录了脸部发音动作的三维运动信息;用绿点标出了部分MPEG4定义的脸部特征点,方便跟踪;可服务于多种视觉
其他文献
从理论和实践的结合上,研究和把握信访工作的规律。作为信访工作者,必须勤奋学习,掌握党和国家的方针、政策、法律、法规等,练好基本功;信访工作必须贯彻执行党的基本路线和
中国入世,将对中国法治化进程产生着深刻影响。入世能否取得预期的效果,在很大程度上取决于政府权力的依法运用。因为尽管在表面上,WTO所涉及的更多的是贸易领域的规则,但是它的
我院第一届工商管理专业硕士研究生班继今年一月底全部通过全国硕士研究生入学考试后,于二月下旬转入ESEC英语培训。 近四个月来,学院十分重视提高学员爱
应具有坚实的外语专业基础、深厚的语言功底、良好的教学方法和教学态度,并在社会科学和自然科学诸方面拓展知识面,还要在实际教学工作中,不断了解石化企业对外语教学的需求,
提出了一种针对GPRS网络中综合业务流量控制方法--双速漏桶算法.并利用流体流法分析了双速漏桶监管的性能,得到实时业务和非实时业务分组丢失率和平均延时的理论公式,数值计
行政执法是现代行政权运作的主要形式,是实施法律法规、履行市场监管和社会管理基本职能的重要手段。行政执法的质量高低,直接关系到经济社会发展法治环境的优劣,关系到行政双方
随着澳大利亚政治、经济和文化的不断进步和发展,一九八七年七月,经过竞选重新执政的澳大利亚工党,对联邦教育机构进行了调整,将教育部正式改名为就业、教育及培训部,其目的
竹节参中分离获得四种皂甙单体:pjs-2,pjs-3,pjs-4,pjs-6。经光谱分析及理化常数测定,证明pjs-2、pjs-4为首次由该属植物中分离得到的齐墩果酸型皂甙;pjs-3为具有强壮安定作