基于关系数据库的关键词模糊查询及结果集排序策略研究

来源 :中南大学 | 被引量 : 0次 | 上传用户:fcsleep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关系数据库的关键词检索技术(KSORD)将使用户不需要任何SQL语言和底层数据库模式的知识,就像简单地使用搜索引擎查询Web一样来获取数据库中的相关数据。KSORD成为目前数据库领域中的一个研究重点,然而,这种关键技术目前只实现了精确查询,还不能很好地实现模糊查询。本文在深入研究王珊教授等人开发的SEEKER系统基础上,发展了基于数字属性的模糊范围查询,并对结果集的排序策略进行了深入研究。对数字属性的关键词进行模糊范围查询时,主要方法是通过对后台数据库的分布分析,然后有针对性地提出隶属函数,并提供系统范围参数,同时在定义模糊化算子用于范围调节的前提下能够将模糊查询转换为具有约束性的精确范围查询。实现查询的过程中,将模糊差值作为对数字属性评分的一个影响因素,保证差值越小的元组返回越靠前。用户是对结果集的最终评价者,然而SEEKER系统中用于对结果排序的评分函数与相关因子如sizeof(T)等有关,这些因子未标准化的情况下,大大影响排序准确度。为提高返回结果序列的排序性能,我们采用空间向量模型表示的方法,对相关影响因子进行标准化处理,通过查询统计分析,表明标准化处理的方法对比传统方法有所改进。因此,本文重点工作即是在提出隶属函数和定义模糊化算子方法后,能实现基于关键词的数字属性模糊查询,并结合实例进行描述和分析。同时证明了基于向量模型法的分析,采用标准化因子的排序函数方法返回查询结果集优于传统未标准化的方法。
其他文献
蓝牙无线通信协议的设备连接机制是通过设备发现实现的。蓝牙设备发现机制的性能直接影响着蓝牙无线通信的效率。本文首先讨论了蓝牙设备连接机制的基本原理,分析了蓝牙无线设
随着计算机视觉、人工智能和思维科学领域的不断发展,数字图像处理的研究和应用正在向更高、更深、更广的层次迈进。图像分割作为模式识别、目标跟踪、图像理解和机器视觉等
随着半导体技术和无线通信技术的不断发展,出现了多种短距离无线通信技术,如HomeRF、IrDA、BlueTooth以及ZigBee等。无线通信技术和网络技术的结合,形成无线网络技术,出现了无线
仿真系统初始化程序往往需要在对系统初始化需求和想定数据组织进行明确理解的基础上开发,而目前系统初始化需求和想定数据组织均缺乏统一规范的描述,初始化变量与想定数据间
工作流技术一直是计算机应用领域的一个研究热点。随着分布式计算技术和高速网络技术的飞速发展,现代企业的信息资源越来越表现出一种异构、分布、松散耦合的特点。在这样的技
PDM(PDM:Product Data Management)是一门用来管理所有与产品相关信息(包括零件信息、配置、文档、CAD文件、结构、权限信息等)和所有与产品相关过程(包括过程定义和管理)的技
SOA对现代软件开发模式产生了深远的影响,它通过服务的发布、发现以及绑定等机制为其他的应用程序提供服务。SOA具有松散耦合、粗粒度、互操作性等优点。通过采用SOA架构的设
随着网络的发展,信息呈几何级增长,而网络信息资源的载体多种多样,加上所处的平台及其使用的语言和标准并不一致这就给各个领域信息资源的管理和使用带来了诸多困难。人们面
回归测试的主要目标是在程序修改后,通过在原有测试用例集中选取部分或全部可用用例,只对修改的部分重新测试。这样既可提高测试效率,又能达到与完全测试相同的测试覆盖。回归测
分类是数据挖掘领域研究的重要课题。常用的分类模型有决策树、神经网络、遗传算法、粗糙集等。本文主要研究决策树ID3算法及其改进算法。首先阐述了决策树的相关理论,并对几种典型的决策树算法进行了分析比较。然后,针对ID3算法存在的不足,提出了基于属性优先关联度的ID3算法(AID3),实验证明AID3算法加快了决策树的构建速度,同时也克服了ID3算法往往偏向于选择取值较多的属性的缺点,随着数据规模的增大