添加音素持续时间信息到频谱模型的说话人辨认研究

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:bendanban
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的声音识别系统通过短时声音频谱信息来辨识说话人.这种方法在某些条件下具有较好的性能。但是由于有些说话人特征隐藏在较长的语音片段中,通过添加长时信息可能会进一步提高系统的性能。在文中.音素持续时间信息被添加到传统模型上,以提高说话人辨识率。频谱信息是通过短时分析获得的,但音素持续时间的提取却属于长时分析,它需要更多的语音数据。通过大量语音数据探讨了音素持续时间信息对说话人辨识的有效性,提出2种方法来解决数据量小所引起的问题。实验结果表明,当说话人的声音模型被恰当建立时,即使在语音数据量小的情况下,音素持
其他文献
随着信息技术的快速发展,短视频、抖音等自媒体迅速崛起,新闻类微信公众号也如雨后春笋般出现,覆盖范围越来越广,给用户带来了全新的新闻体验.但目前新闻类微信公众号普遍存
以智能决策支持系统结构为基础,提出了一种新的电子邮件过滤模型.并对中文垃圾邮件过滤中的中文分词及垃圾邮件特征知识库的更新等关键问题进行了探讨。开发了“智能邮件过滤系
嵌入式系统通常使用LCD作为显示设备,嵌入式Linux下,如果图形界面接口采用的是MicroWindows,MiniGUI或Qt—Embedded,则LCD设备的驱动程序必须采用Linux的帧缓冲设备来处理与LCD控
本文以2012—2019年国内四大主流报纸(光明日报、人民日报、中国青年报、中国教育报)有关翻转课堂的报道作为语料,以内容分析法为主要研究方法,对翻转课堂在中国的接受、推广
脑卒中(Stroke)是一种突然起病的脑血液循环障碍性疾病。临床表现以猝然昏扑、不省人事或突然发生口眼歪斜、半身不遂、舌强言蹇、智力障碍为主要特征。大部分脑卒中患者都存在
通过对265例颅脑损伤患儿进行系统的观察,并采取相应的护理措施。认为观察及护理措施得当,可提高抢救成功率,预防并发症,减轻致残程度,降低患儿病死率。
十年来坚持开展公益关爱行动,结对救助失学儿童523名,帮扶弱势群体5500多人,社会捐款770余万元,受惠群众40余万。  十年间,国家电网山东淄博供电公司发起的“善小”活动,从最初的一个词、一句口号,正凝聚为一种精神,一种无处不在的力量。  “善小”,取自古语“勿以恶小而为之,勿以善小而不为”,其意在鼓励员工从小事做起,从身边事做起,并通过循序渐进、潜移默化的方式,推动“善小”成为全员的自觉意识
2013年12月6日经中共中央批准,中央组织部印发的《关于改进地方党政领导班子和领导干部政绩考核工作的通知》(以下简称《通知》)以具体过硬的措施,深入贯彻落实科学发展观,解决发
儿童线描画对于培养少年儿童的造型表现能力具有非常重要的作用。学生对线描画概念的认识模糊、视野狭隘、技能欠缺,受到了一定的局限,因此作品往往表现不出线条的魅力。本文
随着煤矿企业安全生产的提高,安全仪表的使用已成为重要的环节。但是传统的安全仪表收发管理方式是以人工凭牌发放为主,实际工作中存在着效率低下、操作不规范等问题。针对仪表