论文部分内容阅读
智能化是机械产品设计的发展方向,设计人员设计智能产品的重点在于“人机交互”的接口自然语言理解。自然语言中多义词数量不多,但出现的频率却很高。因此,多义词词义歧义直接影响到后续的深层理解。本文将基于统计和知识相结合的多义词词义识别应用到机械产品设计,通过对客户需求的正确理解实现产品设计的智能化。本文首先阐述了自然语言理解的概述和多义词词义消歧的现状及发展趋势。重点对多义词引起的歧义现象进行分析,针对表示完成时态词语多义词引起的歧义现象,表现出完成时态上的多义性;针对名词或形容词修饰的多义词引起的歧义现象,表现出成词词语被错误切分开所引起的无法确定多义词的正确词义;针对基于统计的方法无法消除的多义词引起的歧义现象,表现出不能确定多义词的正确词义。然后,先通过基于统计的方法处理多义词歧义现象,概括为完成时态的词语多义词歧义处理和名词或形容词修饰的多义词歧义处理;而基于统计的方法无法确定多义词正确词义时,则再通过基于知识的方法对多义词进行歧义处理,得到多义词的正确词义。因此,本文构建出基于统计和知识相结合的词义识别模型,主要包括预处理模块、上下文获取模块、消歧模块和语料库管理模块。其中,着重阐述了消歧模块的功能,即确定多义词的正确词义的步骤。而多义词的词义消歧离不开消歧语料库的支持,本文的消歧语料库是在《知网》的基础上结合互信息、概念的内涵外延和事件的施动受动构建的,且语料库管理模块负责对语料库的维护和及时更新。最后,本文将构建的基于统计和知识相结合的多义词词义识别模型应用到机械产品设计中,帮助企业或设计人员在“交互平台”上分析客户需求,验证多义词识别模型的可行性。