基于静音时长和文本特征融合的韵律边界自动标注

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户：luojing0825

【摘要】

：

韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中不一致、耗时的缺点.仿照人工标注流程,本文运用循环神经网络分别对文本和音频

【作者】

：

傅睿博陶建华李雅温正棋

【机构】

：

中国科学院自动化研究所模式识别国家重点实验室,中国科学院大学人工智能技术学院,中国科学院自动化研究所中国科学院脑科学与智能技术研究中心,

【出处】

：

清华大学学报(自然科学版)

【发表日期】

：

0年期

【关键词】

：

韵律边界标注决策融合静音时长语料库构建语音合成

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

韵律边界标注对于语料库建设和语音合成有着至关重要的作用,而自动韵律标注可以克服人工标注中不一致、耗时的缺点.仿照人工标注流程,本文运用循环神经网络分别对文本和音频两个通道训练子模型,对子模型的输出采用模型融合的方法,从而获得最优标注.本文以词为单位提取了静音时长,与传统以帧为单位的声学特征相比更具有明确的物理意义,与韵律边界的联系更加紧密.实验结果表明,相比于传统声学特征,本文所采用的静音时长特征使自动韵律标注的性能有所提高;相比于直接特征层面的方法,决策融合方法更好地结合了声学和文本的特征,进一步提高了标注的性能. Prosodic boundary labeling plays a crucial role in corpus construction and speech synthesis, while automatic prosodic labeling can overcome the inconsistency and time-consuming shortcomings of manual annotation.According to the manual annotation process, this paper uses cyclic neural network to separate the text and audio channels Training sub-model, the output of the sub-model using the method of model fusion to obtain the optimal annotation.This paper extracts the mute time as a unit, compared with the traditional frame-based acoustic features more explicit physical meaning, and The prosodic boundary is more closely linked.The experimental results show that compared with the traditional acoustic features, the mute duration feature used in this paper improves the performance of automatic prosodic annotation.Compared with the direct feature level method, the decision fusion method better Combines acoustic and textual features to further enhance the annotation performance.

其他文献

尿沉渣检验的干化学法和自动化分析法

尿沉渣检查有"体外肾活检"之称.在泌尿生殖系统疾病患者尿液中,常可镜检出一些有形成分,如细胞、管形、结晶、病原体等.这些有形成分的检出,对疾病的临床诊断和治疗有很大的

期刊

尿沉渣检验干化学法自动化分析法干扰因素

自主合作层层递进有效达成——水平二《技巧——跪跳起》教学设计和思考

回回产卜爹仇贱回——回日E回。”。回祖一回“。回干肉果幻中 N_。NH lP7-ewwe--一”＄ MN。W;- __._——————》砧叫]们羽制作:陈恬’＃陈川个美食 Back to yield

期刊

保护与帮助《技巧——跪跳起》教学设计练习者

鲜枣冷藏过程中生理生化变化的研究

以 5个鲜枣品种为试材 ,研究枣果实采后成熟衰老过程中生理生化变化规律。结果表明 ,0℃下 5种枣果呼吸变化幅度较小 ,均无明显呼吸高峰出现 ,呼吸强度与枣果耐藏性呈负相关

期刊

鲜枣软化呼吸乙烯酶冷藏(贮藏保鲜)

亚磷酸体系镍磷合金电镀工艺及影响镀层耐蚀性的主因素

为了弄清影响亚磷酸体系电镀镍磷合金层耐蚀性能的主因素,用极差法分析了各工艺参数的影响,采用SEM/EDAX考察了镍磷镀层的形貌、成分,采用电化学测试考察了镀层的耐蚀性,测定

期刊

电沉积镍磷合金亚磷酸体系耐蚀性能影响因素

国际摔跤运动项目战术运用研究

国际摔跤比赛作为竞技类体育运动尤其独特的战术运用特征,国际摔跤联合会于2013年修改了摔跤规则,为教练员的战术训练与竞赛战术选择提出了新要求。本文就运动员经常使用的摔

期刊

国际式摔跤战术特点战术运用战术意识

探讨纤维支气管镜在糖尿病性脑血管病并发肺部感染患者中的应用

目的探讨纤维支气管镜在糖尿病性脑血管病并发肺部感染患者中的应用效果。方法将2017年8月—2018年7月期间来该院进行治疗的糖尿病性脑血管病肺部感染患者共计91例作为研究对

期刊

纤维支气管镜糖尿病性脑血管病肺部感染

半导体复合体系光催化降解PVA研究

本文提出用金属氧化物复合体系ZnO-CuO半导体光催化降解PVA水溶液,有较好的效果。研究了在该体系下各因素对PVA光降解的影响,确定了较好的实验条件,并发现空气也是一个重要因

期刊

半导体光催化降解PVA复合体系

光化学臭氧日变化特征与其前体物关系的探讨

应用大气光化学模式研究了日最大臭氧体积分数及其出现时刻与其前体物NMHC、NOx体积分数及NMHC／NOx比值的关系。结果表明，影响日最大臭氧体积分数（ψ03max）脊线位置（EKMA图，Empiric

期刊

光化学臭氧城市臭氧日变化特征臭氧前体物大气光化学模式

公共体育场馆利益相关者改革诉求研究

体育行政部门应合理规划建设体育场馆,改革体育场馆的事业单位属性,采用新型企业化管理方式;体育场馆运营方应坚持＂公益为主、兼顾经营＂的目标定位,确保国有资产的保值和场馆正

期刊

公共体育场馆利益相关者场馆改革

《康县导游词》（节选）汉英翻译实践报告

经济全球化的发展使各国家之间的沟通往来越来越频繁。国家层面的沟通合作有创办论坛、举办会议等,民间沟通交流则可以通过旅游来实现。现如今,国内外发达的交通系统使跨国沟通也变得十分容易。2015年,国家旅游局很好的将国家与民间层面的沟通交流相结合,将该年的主题定为“美丽中国——丝绸之路旅游年”。这一主题不仅贯彻了习总书记提出的“一带一路”战略构想,更使国内外游客收益。康县作为古丝绸之路上的重要驿站,不仅

学位

接受美学导游词旅游文本

基于静音时长和文本特征融合的韵律边界自动标注

与本文相关的学术论文