论文部分内容阅读
该论文关键性工作是:1、设计了汉语听觉视觉双模态数据库的存储结构、数据库语料的选取原则,并实现了一整套双模态数据库的采集录入系统;2、通过两个途径解决了双模态数据库中多媒体数据存取问题,即实现了用PL/SQL编制SQL脚本来操作LOB数据和用VC++通过ODBC来访问数据库中的二进制大对象.3、应用双模态数据库中的资料进行了唇读和人脸特征位置定位的研究,构造了嘴的变形模板并通过优化算法获得了比较准确的发音嘴形特征.