基于端到端句子级别的中文唇语识别研究

来源 :软件学报 | 被引量 : 1次 | 上传用户:sunbody
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着深度学习的广泛应用,唇语识别技术也取得了快速的发展.与传统的方法不同,在基于深度学习的唇语识别模型中,通常包含使用神经网络对图像进行特征提取和特征理解两个部分.根据中文唇语识别的特点,将识别过程划分为两个阶段——图片到拼音(P2P)以及拼音到汉字(P2CC)的识别.分别设计两个不同子网络针对不同的识别过程,当两个子网络训练好后,再把它们放在一起进行端到端的整体架构优化.由于目前没有可用的中文唇语数据集,因此采用半自动化的方法从CCTV官网上收集了6个月20.95GB的中文唇语数据集CCT
其他文献
2009年世界经济在百年不遇的全球金融危机中“起死回生”,中国经济更是创造增长奇迹。一年多来,中国经济的韧性和应对大危机的宏观调控能力逐步增强,在货币政策与财政政策、产业
疫情所造成的经济和市场的变化,使各行业正面临巨大的挑战。对制造业来说,一方面,疫情影响持续,使人们的出行受到诸多限制,客户的正常参观流程受阻;另一方面,参观公司等线下
经过了近十三个年的发展,电子商务在中国从名不见经传的小角色快速成长为中国经济的重要组成部分。电子商务改变了传统贸易的模式,实现了贸易的低成本化和便捷化。理论界对电子
软件不变量是软件的重要属性,在软件验证、软件调试和软件测试等领域有重要作用.自20世纪末以来,基于动态分析的不变量综合技术成为相关领域的一个研究热点,并且取得了一定的
《〈基础教育课程改革纲要(试行)〉解读》指出,有效教学是为了提高教师的工作效益、强化过程评价和目标管理的一种现代教学理念。由此可知,在新课程背景下,我国高中政治课堂实施有
进入新世纪以来,重庆市把土地作为宏观调控的重要手段之一,调控和促进经济发展方式转变,取得了一些经验和成效。一、以土地调控引导经济结构调整近年来,重庆经济结构调整取得重大
作为社会媒体文本情感分析的重要研究课题之一,跨领域文本情感分类旨在利用源领域资源或模型迁移地服务于目标领域的文本情感分类任务,其可以有效缓解目标领域中带标签数据不
新课程理念倡导品德教学回归生活,强调以小学生现实生活为课程基础。因此,在品德教学中需要特别关注小学生的现实生活,把课程与小学生的生活密切的联系起来,使小学生的品行在现实
"如何构造高可信的软件系统"已成为学术界和工业界的研究热点.操作系统内核作为软件系统的基础组件,其安全可靠是构造高可信软件系统的重要环节.为了确保操作系统内核的安全
在X射线荧光光谱(EDXRF)测试中,由于探测器分辨率的影响,谱线会有不同程度的展宽,多元素存在时谱线还会有一定的重叠。获得纯净的谱线强度,并保证准确测试结果的过程,通常被