【摘 要】
:
针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的
【基金项目】
:
上海市青年科技英才扬帆计划(14YF1409300)资助项目;国家自然科学基金(61701306)资助项目
论文部分内容阅读
针对具有大段连续文本标注、但无时间标签的电视剧语音提出了一种半监督自动语音分割算法。首先采用原始的标注文本构建一个有偏的语言模型,然后将该语言模型以一种半监督的方式用于电视剧语音识别中,最后利用自动语音识别的解码结果对传统的基于距离度量、模型分类以及基于音素识别的语音分割算法进行改进。在英国科幻电视剧“神秘博士”数据集合上的实验结果表明,提出的半监督自动语音分割算法能够取得明显优于传统语音分割算法的性能,不仅有效解决了电视剧语音识别中大段连续音频的自动分割问题,还能对相应的大段连续文本标注进行分段,保证分
其他文献
<正>转向节是汽车转向系统的重要组成部分。其功用是承受汽车前部载荷,支承并带动前轮绕主销转动实现汽车转向。汽车行驶状态中转向节承受着多变的冲击载荷,因此它的疲劳强度
本文介绍了CE-1卫星总线控制器软件研制的工程需求、软件的设计思路和测试过程, 针对该软件研制过程中出现的问题指出了航天软件研制过程中的需求、软件质量控制与进度控制之
企业重视员工的存在,这是我们都必须承认的事实,作为依附于企业存在的个体,员工的工作以及行为活动都会对企业的利益产生影响。人才的获得可以通过许多途径,但最主要的是招聘
癌症的发病率、死亡率长期位居各种疾病之首,全球每年有超过1000万人死于癌症,癌症患者的5年生存率仅有15%~30%。为提高癌症病人的存活率,大量的研究人员开始对影响癌症生存
目的通过lnc RNA RP4-612B15.3慢病毒质粒的构建并观察其对SW-480细胞株的影响,从而探索lnc RNARP4-612B15.3在结直肠癌发生发展过程中的作用。方法通过转染lnc RNARP4-612B1
本文介绍了微机自动配料系统的原理和组成、具体应用情况以及系统的发展趋势。
阅读教学是培养学生阅读能力的重要过程,但阅读教学对学生的知识基础和认知能力有着较高的要求,而学生的阅读能力存在差异性又是客观事实。实施分层教学正是基于此背景,它抓
改革开放以来,我国三次产业结构变动的基本趋势是:第一产业比重大幅下降,第二产业比重比较稳定,第三产业比重上升较快,这种变化符合产业结构演变的一般规律。但与国际标准模式
遥感数据的“尺度效应”是客观存在的。不同空间尺度的遥感数据、遥感反演的模型以及得到的遥感产品这些都存在这种尺度效应。数据点的空间信息与像元面的空间信息能否匹配仍
在MOOC(慕课)技术与平台日益发展与成熟的背景下,结合了网络教学与课堂教学优点的混合式教学模式成为研究热点,也是目前高校教学模式改革的一个重要研究方向。文章以高职院校《