论文部分内容阅读
全过程计算机辅助动画自动生成技术是中科院陆汝钤教授于上世纪90年代提出的,该技术是一项全新的基于人工智能与计算机动画结合的研究领域。其目的是希望从自然语言书写的故事开始,直至最终动画的生成,每一步都在计算机的辅助下完成。手机3D动画自动生成技术就是将全过程计算机辅助动画自动生成技术在手机短信领域的一个应用,是一个崭新的课题。手机3D动画自动生成技术是中科院张松懋研究员于2008年审视了3G通信技术及相关应用背景后提出的,目的是将发送者的短信依据其本身内容,自动的生成与短信内容相应的3D动画并传送给接收方。其中间的处理过程非常复杂,大致可包括以下四个部分:信息抽取、情节定性规划、场景定量规划和网络渲染。本文的主要工作是信息抽取知识库维护系统的设计与实现,其中主要包括模板库维护和原子库维护两部分。本文的主要贡献包括以下几个方面:第一,设计并实现了信息抽取知识库的基本维护功能。目前,信息抽取知识库中有23个模板,380个相应的子模板,3079个原子信息,这些信息都存储在数据库中。知识库的基本维护功能包括模板和原子的添加、删除功能,今后无需直接对数据库进行操作,而只需按照界面提示进行操作即可,且通过中间的检查判断机制,可一定程度防止冗余数据的出现。第二,实现数据库新增原子的语义检查。本文基于现有《同义词词林》和《知网》实现了原子的语义判断,提高了信息抽取的质量。其中,《同义词词林》用于词语同义性判断,而《知网》作为补充,用于词语相似度判断。第三,设计并实现模板检查系统。模板检查包括模板一致性和完整性两部分的检查。其中,一致性检查包括模板中冗余、循环和冲突规则的检测;完整性检查包括遗漏规则和不可达子句的检测。因模板结构采用受限的EBNF的形式定义,模板结构可被看成一颗与或树的形式,故本文采用“数据库+规则”的形式来实现对模板与或树的检查。同时,通过对模板库的测试发现,有4个模板存在冗余现象;1个模板存在循环现象;5个模板存在冲突现象。信息抽取知识库维护系统初步实现了模板和原子的基本维护功能、数据库新增原子的语义检测以及模板检查的功能,对信息抽取知识库的维护具有一定的实用性。但知识库的维护系统仍需要从以下三个方面进一步改进:一、原子语义检测模块词典库的扩充及引入机器学习的方法;二、实现模板库维护与原子库维护的相互支持;三、检测模板中词义模糊的结点。