基于语速差异的新闻发布会中首要说话人检测

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:jovin_chow
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
新闻发布会中,首要说话人(例如政府要员)通常要即兴回答记者事先准备好的问题。因而首要说话人语速一般很慢,而其他说话人(例如记者、翻译等)语速则相对较快。基于两者的语速差异,采用一个滑动窗从连续语音流中截取语音段,再估计各音段语速得到一条语速曲线,然后寻找语速曲线中的局部最小值进而得到两类说话人的改变点,最后将语速低于门限且在两相邻改变点之间的语音段判为首要说话人语音,从而实现首要说话人检测。实验结果表明,与传统方法相比,基于语速差异的方法获得了更好的性能。
其他文献
气体的一维定常流动是《工程流体力学》课程中的重要教学内容。公式记忆量大,计算繁复,一向是教学的难点之一。作者根据教学经验提出新的计算方法,具有思路清晰、易学易记、
目前无参考图像质量评价方法中存在的量化精度不高和受图像对比度、纹理结构影响大等不足,难以用于高通量基因测序图像质量的检测。为此,在分析了黑色背景图像上叠加规则白色形状的同态傅里叶变换的基础上,提出了一种基于频率域的图像质量评价模型。该模型通过对频率域所表现出的图像纹理结构进行预处理,最终建模实现了高通量基因测序图像质量的评价指标。实践表明,该方法在评价高通量基因测序图像质量中具有较好的量化精度和可
本文研究了弦支穹顶结构在多维多点地震动激励下的响应情况,对40m、80m和120m跨度的弦支穹顶结构进行时程分析,列出了结构在不同视波速下三向及单向输入地震波行波激励下的地震
总结地龙有效化学成分(生物活性成分)、药理作用、临床应用注意事项的研究现状,为今后的开发利用和临床合理使用提供依据。
篮球在我国是一种拥有广泛参与度的球类运动,深受各个年龄段的学生喜爱。习近平总书记于2014年8月15日看望夏季青奥会中国代表团时曾强调:把“三大球”搞上去,只有打好地基才
对模态分析基本理论及ANSYS环境下模态分析的过程进行了概述,对高层框架一简体结构进行模态计算分析,得到了此模型的固有频率和相应的振型,可供使用ANSYS的工程技术人员参考。
建筑结构产生裂缝是建筑工程中的普遍现象,对建筑物及构件的使用功能、使用寿命产生直接影响,而钢筋混凝土结构裂缝是最常见现象之一。本文分析钢筋混凝土结构裂缝产生的原因,并
购物中心的城市功能需要我们研究寻找新的购物中心的设计方向,以此对社会生活的需求作出反应,这一切需要重新认识购物中心的场所营造。本文通过对购物中心的场所营造进行科学
7月17日,广东省湛江海螺水泥有限责任公司320万吨/年水泥粉磨站工程竣工环保现场验收一次性通过。
解码时声学特性最优的路径蕴含了揭示当前路径是否正确的重要参考信息,为此提出了一种随机段模型系统的解码优化方法。训练能够准确地衡量当前路径与声学最优路径相似性程度