论文部分内容阅读
本文主要研究了体宾动词和名词以及谓词动词与动词构成的动宾搭配。文章介绍了已有的一些识别搭配对的方法:使用频率信息的搭配识别,基于均值与方差的搭配识别,基于假设测试和互信息的搭配识别,基于熵的搭配识别,以及统计定量描述词语搭配所需的三个评价指标及其判别搭配的算法;从语料库中获取大量实例,特别是统计方法判别错误的实例,通过人工以及人机交互的手段对实例分析,总结出动词与名词的搭配识别规则,同时对获取的规则进行了实例分析。结果表明这些规则可以正确识别语句中的词语搭配,提高识别搭配的准确率和召回率;利用统计方法与规则相结合的方法,对语料中获取的句子进行了搭配测试,测试的结果表明,该方法是可行的。