基于规则的词语搭配识别研究

来源 :山西大学 | 被引量 : 0次 | 上传用户:shengli46
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文主要研究了体宾动词和名词以及谓词动词与动词构成的动宾搭配。文章介绍了已有的一些识别搭配对的方法:使用频率信息的搭配识别,基于均值与方差的搭配识别,基于假设测试和互信息的搭配识别,基于熵的搭配识别,以及统计定量描述词语搭配所需的三个评价指标及其判别搭配的算法;从语料库中获取大量实例,特别是统计方法判别错误的实例,通过人工以及人机交互的手段对实例分析,总结出动词与名词的搭配识别规则,同时对获取的规则进行了实例分析。结果表明这些规则可以正确识别语句中的词语搭配,提高识别搭配的准确率和召回率;利用统计方法与规则相结合的方法,对语料中获取的句子进行了搭配测试,测试的结果表明,该方法是可行的。
其他文献
思维导图力求通过图文并茂的手段完成对不同信息的可视化解读.作为一项基本思维工具,成功地影响着人们的思维方式和认知手段.高中阶段的历史课程具有信息量大、理解难度高、
本文利用发生函数法及微积分理论研究了几类经典的组合序列如二项式系数、Salié数、Delannoy数的性质以及推广的Bernoulli和Euler多项式所满足的漂亮恒等式。论文的主要内容
单小波作为一种成熟的多分辨方法已经在信号处理,图像处理的各个领域得到了极为广泛的应用。然而,在许多情况下,传统单小波的性质不能满足全部需要。比如单小波除Haar小波外不可
小学班主任工作要认真仔细,培养学生德、智、体、美、劳五爱教育,加强素质教育.从小养成学生良好的行为习惯,好好学习,天天向上,争做优秀学生,让学生在快乐中健康成长.
具有低相关性的伪随机序列集在码分多址(CDMA)扩频通信系统和密码系统中具有极其重要的作用.作为CDMA扩频通信系统中的扩频序列集,低相关性的伪随机序列集能够成功降低来自同
当前自媒体在不断的发展,这样也就使得信息传播面临着非常大的转变,信息传播在实际的工作中已经不再是传统的传播方式,在传播方式上经历了非常大的转变,在这样的时代背景下,
语文教学的首要任务是培养学生运用语言的能力,准确地说,就是要引导学生掌握听、说、读、写的能力。那么,怎样才能让学生拥有这些能力呢?本文笔者结合多年初中语文课堂教学实
本文对多输出支持向量回归机算法中线性系统(3.3)式的系数矩阵进行了研究,给出了其条件数上界的估计定理及详细的理论证明过程,并通过实验验证估计定理的正确性与实用性.  关
本文主要在正则元集不是纯正子半群的一类π-正则半群(主要是GV-半群)中研究同余,其主要思想是核和迹的推广,再适当添加某些条件,给定同余对的概念,最后找到同余和同余对之间的一
学位