论文部分内容阅读
能够使得计算机理解人类的语言,并且与人类对话,已经成为目前自然语言理解和人工智能领域的研究热点。问答系统就是为了完成这个任务而诞生的,而且是备受关注的研究方向。阅读理解问答系统作为问答系统中的一个重要分支,它主要利用自然语言技术和信息检索以及机器学习技术自动的分析一篇或多篇文章,并从中获取简洁而又准确的答案;近年来,语音问答系统也备受关注,它主要是结合语音识别和传统问答系统来实现的,IBM的Watson就是目前能够挑战人类的语音问答软件。本文首先分析了各种问答系统的特点,然后根据阅读理解问答系统的独特性提出了适合它的两个主要模块:问句分类和答案提取。提取问句的重要信息(词汇(Word)、词性(POS)、命名实体(NE)、语义信息)作为分类特征,采用了有效的特征加权方法把问句表示成向量,然后用SVM和半监督学习方法识别问句的类型。在通用的基于VSM的句子相似度计算方法的基础上,针对阅读理解问答系统的特点提出了多种改进方法,主要考虑了句法和语义等丰富的信息。本文另一个重要模块就是结合三维虚拟人技术和可视化技术,设计一个能够进行语音问答的三维虚拟人。这个模块阐述了如何利用拼音模糊匹配技术解决语音识别的不准确性,实现语音识别和传统问答系统的结合,使得这个虚拟人不但具有视觉功能和表情功能,而且具有语音交互功能,使得人机交互更加自然和谐。最后本文分析了整个语音问答系统的实现和实验结果及其评价。实验的结果表明,每个模块都取得了很好的实验效果,总的来说虚拟人具有了较强的阅读理解能力。最终的语音问答系统不但准确率高,而且3D效果非常逼真,交互非常和谐。