面向人机互动的自然语言理解的研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wjlovewz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器人服务于人类时不可避免地需要进行人机互动。合适的人机互动能使机器人更好地理解人的意图,也使人能了解机器人当前的状态。但要实现自然的人机互动,需要解决机器人的行动能力、多用性、以及理解能力等方面上的挑战。本文提出利用人类知识来提高机器人在非预测情况下完成任务的能力,解决多用性问题。机器人要理解人类知识,归根结底需要理解人类的自然语言。同时,自然语言作为用户与机器人交互最自然的方式,理解自然语言是机器人的基本要求。因此,本文通过解决机器人在自然语言理解中的问题,实现大规模自然语言理解,从而解决自然人机互动所面临的问题。本文从三方面逐步提高机器人理解自然语言的能力。第一,解决以自然语言为载体的开放性知识语义提取问题。由于机器人在设计时无法预测所有可能的情况出现,机器人需要动态地从外部获取开放性知识以弥补完成任务所需的缺失知识。机器人要理解以自然语言为载体的知识,需要理解自然语言。同时这些知识可能存在着多种模式,半结构化或自然语言形式。为此,本文提出多模式自然语言处理技术,使用统一、通用的语义解析机制,对多种模式的开放性知识进行深度语义的提取。此外,以自然语言为载体的知识,往往因为撰写者的上下文预设而造成某些语义信息被隐含。因此,面向预设的语义修复方法被引入,以保证语义提取的结果是完整的、能正确表达原有知识的含义。第二,解决人机互动中行动知识与交互语言的统一形式化表示问题,以及大规模自然语言理解问题。人机互动中的自然语言理解需要机器人能够理解行动知识中的自然语言和用户用于交互的自然语言。通用的语义解析需要一种统一的形式化表示来表达这两种不同类型的自然语言的含义。本文对此提出人机对话表示形式。在大规模自然语言理解中,对自然语言进行语义解析往往存在着不确定性和歧义的情况,因此本文引入概率语义解析。概率语义解析的另一好处是还可以通过监督学习算法,从标注有语义形式的语料中训练得到所需的词典,避免了人工构建词典的大量工作。第三,解决大量标注语料的获得问题。大规模的自然语言理解要求语义解析所覆盖的单词面足够广。但要实现覆盖面广的语义解析,往往需要大量的标注有语义形式的训练样本。而实际中很难实现大量的语料标注,因为这需要消耗大量的时间和精力。对此,本文提出词典传播方法,将覆盖面小的词典通过大量未标注语料扩展成覆盖面大的词典,从而实现覆盖面广的语义解析。词典传播方法只需要少量的标注语料作为初始词典的训练样本,大量未标注语料解决了词典的覆盖面问题,从而解决标注语料的获得问题。
其他文献
同互联网的流行与传播一样,手机作为信息传播新媒体,青少年群体使用得更 为活跃。在校园,手机已经对这些正处于发育时期的学子在思想观念、价值取 向、思维方式、行为模式、
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技
应用杆状病毒蛋白表达系统在Sf9细胞中对人肝脏辅酶Ⅱ依赖性视黄醇脱氢/还原酶(NADP-dependent retinol dehydrogenase/reductase,NRDR)进行表达。以纯化的重组蛋白质为材料,分
企业的内部控制是企业通过建立相关制度对企业的生产、销售、经营等在内的各个因素进行全面规范管理,以达到控制企业生产经营风险、保障企业信息真实有效的目的。其实质上是
由于对方舱屏蔽性能要求越来越高,电源/信号孔口及转接壁盒的设计和安装成为屏蔽方舱设计和加工的关键环节.总结了电源/信号孔口及转接壁盒的功能作用和对方舱屏蔽性能的影响
博尔赫斯的《小径分岔的花园》,以构思精巧、玄秘深奥而闻名于世。博尔赫斯将其视作与读者进行交流的媒介,在文本中留下了大量的结构性空白,并通过对读者阅读范式的否定,形成
传统文化作为我国传承历史文明的重要途径,其不仅见证了我国文化发展和历史演变,同时也成为我国民族精神传承的重要载体。作为高中语文教师,要想培养学生文化素养和思想道德,就必
随着科学技术的日益发展以及互联网在人民大众生活中的普及,电子商务是我们日常生活中一个重要的组成部分,而作为电子商务最关键的的环节——物流配送,也展现出具大的研究价