【摘 要】
:
词义消歧是自然语言处理中的热点和难点问题,对机器翻译、信息检索、句法分析及文本分类方面的研究,有着极其重要的理论及实践意义。现阶段词义消歧技术,因为词义知识获取中的瓶
论文部分内容阅读
词义消歧是自然语言处理中的热点和难点问题,对机器翻译、信息检索、句法分析及文本分类方面的研究,有着极其重要的理论及实践意义。现阶段词义消歧技术,因为词义知识获取中的瓶颈因素、词义消歧知识库的质量及词义消歧模型的优劣问题,消歧正确率一直不太理想。因此,如何进一步提升词义消歧的处理效果,一直是科研人员在词义消歧领域研究的动力和目标。
本文首先简述了词义消歧主要研究方法,并对词义消歧主要技术进行评述。其次,介绍了词义消歧相关概念及《同义词词林》、《现代汉语语义词典》、知网等语义分类体系。然后,讨论了决策树与决策表、神经网络预测模型、最大熵方法、隐马尔可夫模型、贝叶斯模型等词义消歧相关模型。在此基础上,阐述基于知网和贝叶斯模型的词义消歧,阐述内容包括依存句法分析、基于知网和贝叶斯模型的词义消歧的体系结构、基于知网的词义消歧过程、贝叶斯模型的改进方法、基于知网和依存句法分析的贝叶斯推理、基于知网和贝叶斯模型词义消歧流程、基于知网和贝叶斯模型词义消歧算法以及模型训练与消岐示例。最后,进行词义消歧模型的实验测试和性能分析,内容包括实验用语料库、测试说明、实验结果、对比和分析。关于实验结果,包括神经网络预测模型的实验结果、隐马尔可夫模型的实验结果、贝叶斯模型的实验结果、基于知网和贝叶斯模型的实验结果;关于对比和分析,包括神经网络模型与贝叶斯网络模型的实验对照分析、隐马尔可夫模型与贝叶斯模型的实验对照分析、贝叶斯模型与基于知网和贝叶斯模型的实验对照分析。实验表明,笔者研究的基于知网和贝叶斯模型的词义消歧技术,在几种词义消歧模型中具有比较突出的优势。
其他文献
导轨作为电梯的导向部件,导轨的质量决定着电梯能否安全、舒适、高速地运行,而导轨的直线度误差是决定着导轨质量的最主要因素。目前行业内的常用的直线度检测方法,检测器具
板厚精度是钢板轧制的重要指标之一,板厚控制也是轧制领域中核心技术之一。自动厚度控制是一种对轧板中心部分的板厚进行自动控制的技术,近年来成为热轧板带钢轧机以及冷轧机
永磁无刷直流电机凭借体积小、重量轻、效率高和转动惯量小等优良特性,在工业控制领域中占据重要地位。除此之外,在具备直流电机优良的调速特性的同时,电子换相装置代替了直
神经网络逆控制方法是一种不依赖于被控系统精确模型、应用广泛的非线性控制方法。但是该方法在具体应用时还存在一些问题有待解决,主要是当被控系统的参数发生较大变化等不
滚动轴承在旋转机械中起着重要作用,同时,也是机械零件中最容易发生故障的零部件之一。一旦滚动轴承发生故障,在列车的高速重载运行中,故障会进一步扩大,从而造成热轴、燃轴
无人化平台可以代替人工作在危险或恶劣环境中,其在军事、工业、农业等众多领域都已得到了广泛应用。本文所研究的无人化平台主要由现场节点、远程操控台和指挥中心三部分组
随着人类对资源需求的日益增加,丰富的海洋资源被越来越多国家所重视。作为海洋勘探与开发的重要工具,遥控式水下机器人(Remotely Operated Vehicle,ROV)可代替人类进行水下
电梯导轨作为电梯的导向系统,是影响电梯安全性与舒适性的重要部件。多数导轨冷加工后,直线度达不到规定要求,需要校直机校直。随着电梯导轨工业的迅速发展和电梯导轨企业对
运动控制器广泛应用于数控,印刷,机械加工等行业。本文首先介绍了运动控制器在国内外的发展历程,发展现状,插补算法,分析了通用运动控制器中存在的问题,接着提出一种基于ARM
PID控制器因其结构简单、控制能力强,广泛应用于各种工业控制领域;近年来确定PID参数三维稳定域问题逐渐成为热点;时滞现象在实际系统中普遍存在,从而产生了具有广泛工程背景的