中文数据库自然语言查询接口技术研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:xiajie318
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库应用及信息检索技术的广泛普及,越来越多的非专业用户需要一种易于掌握的界面去访问所需的信息。数据库自然语言接口(NLIDB)技术在这种需求中应运而生。它大大简化了人机交互的过程,使用户可以以自己熟悉的自然语言和应用领域的概念访问去访问数据库。随着各个企业对于数据库应用的需求越来越强烈,对中文数据库自然语言查询技术的研究将具有重要的理论意义和实用价值。本文研究的内容是设计和实现一个中文数据库自然语言接口系统,主要有以下几方面的研究成果:   1.设计了一个具有良好可用性、可移植性的数据库自然语言接口模型。该模型在设计上把程序设计与知识库分离开来。自然语言处理部分包括词法分析、句法分析、中间语言转SQL语言等几个独立模块。知识库部分划分为通用知识库和专用知识库。这种设计使其具备了较强的可移植性,便于系统的移植和进一步扩充。   2.使用了一个基于统计与数据库语义相结合的词法分析方法。该模块不仅将汉字切分为词、标注词性,而且进一步划分每个词的数据库语义类别,对于非通用词类还标注出其数据库语义。通过相关语义确定法等实现对对于多义词的排歧。对于含有数据库隐含知识的词也给出了详细的处理方法。   3.实现了一个基于数据库语义的依存文法分析模型。该模型详细定义了数据库对象之间的依存关系,并给出了判定规则。它最终输出中间语言——一棵具备良好的向SQL转换能力的语义依存树。最后本文给出了中间语言向SQL转换的算法。本系统支持复杂的自然语言查询语句,包括嵌套查询、含量词和否定词的查询、分组查询以及含聚集函数的查询等。   最后构建了一个原型系统,应用于教务、天气领域的查询。实验表明,该系统基本能够有效地处理各种常见形式的查询请求,具有良好的可用性和可移植性。
其他文献
随着计算机图像处理技术的迅速发展,计算机机器视觉技术作为一种核心技术被广泛的应用于工农业生产领域,并成为人工智能领域内的热门研究课题。而计算机机器视觉技术在农业上的
图像分割是依据边缘、区域、噪声分布、颜色、纹理、光流场等特征及相关先验知识(诸如先验形状)将图像划分为不同区域。借助变分水平集方法,图像分割的变分水平集模型得以快
煤炭是我国的重要能源,而煤矿水害已经成为矿井灾害的主要因素之一。论文结合影响煤矿发生水害等多种因素,在充分了解国内外相关领域研究现状基础上,进行了矿井水害预警专家系统
实际工业生产中需要对产品的三维结构和几何尺寸进行建模。传统的三维建模方法在工业生产中存在着种种限制。本文以计算机视觉和计算机图形学为理论基础,研究了利用单个数码
随着人们对个人隐私保护意识的不断增强,个人数据的隐私保护已成为信息安全的一个重要研究方向。未经处理的原始数据中通常含有个体的某些隐私信息,它们的发布和共享会对个体
RFID(Radio Frequency Identification)技术,即无线射频识别技术。RFID技术是一种非接触的自动识别技术。在零售、物流、交通、医疗、国防等多个领域有着广阔的应用前景。随
随着互联网的迅速发展和信息化技术的深入,面向各个应用领域或行业需求的软件得到了广泛的应用,大大提高了我们的工作生活效率和质量。计算机软件产业在迎来巨大发展机遇的同时
网络安全问题随着互联网的迅猛发展变得日趋错综复杂,传统安全防御技术已很难满足目前网络安全的需要,入侵检测技术作为一种主动的安全防护技术已成为计算机安全策略中的核心技
在软件回归测试中,由于客观因素(例如时间、成本等)的制约,庞大的测试用例集不可能全部被执行。测试用例预优化是一种通过调整测试用例的执行顺序来优化回归测试过程的技术。传统
学位