论文部分内容阅读
自然语言处理(Natural Language Processing,简称NLP)研究的核心问题就足为机器构造自然语言的语言模型,由于自然语言的非结构化和开放性的特点,传统的规则型语言模型和基于统计的语言模型很难单独解决NLP中面临的问题。本文从对象的视角为自然语言建立语言模型,主要思想是:对自然语言中的字、词、句、篇章和文档等看成是粒度不同的对象类,并根据基本的语法规则总结得到这些对象类的基本属性特征,而每个特定对象则基于语料库用统计(法)统计其在上下文中特定的使用方法并作为该对象的扩展特征,这样可以将规则方法和统计方法较好的结合起来,并用统一的方法对各类对象进行分析处理,试图为NLP提供一种新的解决方案。