论文部分内容阅读
语言串分析法基于符号和规则的处理方法很多,不能一一列举,只介绍我拟使用的“语言串分析法”.国内有些学者将其称为“语符列分析法”,似乎学术味更浓些.这个方法是由美国结构主义语言学代表人物海里斯于1962年提出的,据说他是乔姆斯基的老师.实际上,语言串分析法的提出要晚于乔姆斯基提出的短语结构文法,只是后来似乎缺乏进一步发展,并没有短语结构的影响力大,但它是世界上最早在计算机上真正实现的自然语言处理模型.其中比较著名的有N?塞杰尔于20世纪80年代研制的语言串分析器LSP,它包括大约250条上下文无关规则和200条限制,收词近1万条,据称是迄今为止覆盖面最广的英语语法系统之一,并在美国医学信息管理系统的语言处理方面获得了相当大的成功.选择这个模型的理由,将结合对模型的介绍和实例分析进行说明.另外,本文也将引入关键词提取、短语结构、上下文相关、数据库语义学、语义场等目前广泛使用的概念,进一步丰富语言串分析法的应用.