汉语听觉视觉语音识别双模态数据库的建立及应用

来源 :北京航空航天大学 | 被引量 : 0次 | 上传用户:cds123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该论文关键性工作是:1、设计了汉语听觉视觉双模态数据库的存储结构、数据库语料的选取原则,并实现了一整套双模态数据库的采集录入系统;2、通过两个途径解决了双模态数据库中多媒体数据存取问题,即实现了用PL/SQL编制SQL脚本来操作LOB数据和用VC++通过ODBC来访问数据库中的二进制大对象.3、应用双模态数据库中的资料进行了唇读和人脸特征位置定位的研究,构造了嘴的变形模板并通过优化算法获得了比较准确的发音嘴形特征.
其他文献
TD-SCDMA HSPA+技术是TD-SCDMA系统演进的重要方案,其通过引入MIMO、高阶调制和改进的L2层等技术显著提高了系统的性能。联合检测技术以其较低的多址干扰和多径干扰是TD-SCDM
该文对抗干扰通信系统、设备的抗干扰性能的评估方法进行了深入研究,选择了数学规律较强的模糊聚类和模糊模式识别方法进行抗干扰通信系统的评估,重点分析与讨论了三种模糊模
该课题从分析多普勒频移产生的原理入手,深入探讨了在QPSK调制图像信号的情况下多普勒频移对信号解调的影响,分析了多普勒频移导致误码率增大的原因,并且对此进行了定量分析.
本文通过对荣华二采区10
期刊
【摘要】非正式学习是语文教学的需要,是指导学生的需求,是语文教师实现自我发展的途径,也是新世纪对语文教师的必然要求。广大语文教师要明白非正式学习的作用,增强非正式学习的意识,落实非正式学习的行动,勤于阅读,乐于交往,善于反思,注重网络学习,积极参加教学研究,认真聆听专家报告,努力促进自己的专业成长。  【关键词】非正式学习;语文教师;专业成长  【中图分类号】G633 【文献标识码
本实验选用不耐铅的蚕豆品种进行两种处理,一是分别用浓度为0、0.02、0.10、0.50、1.00、1.50mmol/LPbCl2溶液进行胁迫处理,二是用在1.00mmol/LPbCl2中分别加入0、0.5、1、5、1
近年来,超快激光技术得到快速发展,激光脉宽可以达到飞秒级别,推动了激光成像的多方面发展。研究者们利用超快激光技术和高灵敏度、高时间分辨率的探测器,完成了瞬态成像,并利用这
生物学是一门需要学生不断地探究的学科,需要他们去发现问题,再去解决问题.近几年随着生物科学与技术的发展,生物学经历前所未有的变革与创新,时代的进步、学科的发展对初中
小叶锦鸡儿(Caragana microphylla Lam.)与中间锦鸡儿(Caragana intermedia Kuang etH.C.Fu)为锦鸡儿属植物,其中,小叶锦鸡儿为典型草原及荒漠草原的旱生灌木,而中间锦鸡儿为典型
该文的工作主要是对AMR声码器的信道编码进行研究,首先从语音编码制式入手,对声码器自身抗信道误码能力和纠错编码的抗信道误码能力进行总结;分析了中文语音参数对信道的敏感