论文部分内容阅读
机器人服务于人类时不可避免地需要进行人机互动。合适的人机互动能使机器人更好地理解人的意图,也使人能了解机器人当前的状态。但要实现自然的人机互动,需要解决机器人的行动能力、多用性、以及理解能力等方面上的挑战。本文提出利用人类知识来提高机器人在非预测情况下完成任务的能力,解决多用性问题。机器人要理解人类知识,归根结底需要理解人类的自然语言。同时,自然语言作为用户与机器人交互最自然的方式,理解自然语言是机器人的基本要求。因此,本文通过解决机器人在自然语言理解中的问题,实现大规模自然语言理解,从而解决自然人机互动所面临的问题。本文从三方面逐步提高机器人理解自然语言的能力。第一,解决以自然语言为载体的开放性知识语义提取问题。由于机器人在设计时无法预测所有可能的情况出现,机器人需要动态地从外部获取开放性知识以弥补完成任务所需的缺失知识。机器人要理解以自然语言为载体的知识,需要理解自然语言。同时这些知识可能存在着多种模式,半结构化或自然语言形式。为此,本文提出多模式自然语言处理技术,使用统一、通用的语义解析机制,对多种模式的开放性知识进行深度语义的提取。此外,以自然语言为载体的知识,往往因为撰写者的上下文预设而造成某些语义信息被隐含。因此,面向预设的语义修复方法被引入,以保证语义提取的结果是完整的、能正确表达原有知识的含义。第二,解决人机互动中行动知识与交互语言的统一形式化表示问题,以及大规模自然语言理解问题。人机互动中的自然语言理解需要机器人能够理解行动知识中的自然语言和用户用于交互的自然语言。通用的语义解析需要一种统一的形式化表示来表达这两种不同类型的自然语言的含义。本文对此提出人机对话表示形式。在大规模自然语言理解中,对自然语言进行语义解析往往存在着不确定性和歧义的情况,因此本文引入概率语义解析。概率语义解析的另一好处是还可以通过监督学习算法,从标注有语义形式的语料中训练得到所需的词典,避免了人工构建词典的大量工作。第三,解决大量标注语料的获得问题。大规模的自然语言理解要求语义解析所覆盖的单词面足够广。但要实现覆盖面广的语义解析,往往需要大量的标注有语义形式的训练样本。而实际中很难实现大量的语料标注,因为这需要消耗大量的时间和精力。对此,本文提出词典传播方法,将覆盖面小的词典通过大量未标注语料扩展成覆盖面大的词典,从而实现覆盖面广的语义解析。词典传播方法只需要少量的标注语料作为初始词典的训练样本,大量未标注语料解决了词典的覆盖面问题,从而解决标注语料的获得问题。