基于查询模板的关键词聚集查询研究

来源 :河北大学 | 被引量 : 0次 | 上传用户:chenhuaxys
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着数据库技术的广泛应用,大量的数据存储到了数据库中。通过关键词查询方式访问数据库,成为了信息检索、数据库领域学者关注的研究热点,有着广泛的应用价值和研究价值。数据库关键词查询研究大多重点关注的是找到一组能够最优匹配关键词的元组,即某个表中的一个元组或由多个表进行连接而得到的元组。目前大多数的研究只能支持简单类型的关键词查询,无法支持比较复杂的聚集查询。针对此问题,本文对关键词聚集查询进行了研究,主要工作包括以下三个方面:在对关键词预处理时,对用户指定的关键词处理时用符号表来定位关键词在关系数据库中的位置;采用近似字符串匹配算法来判断关键词与查询项中的元素匹配的程度;给出查询项的概念,通过对每个关键词匹配表的叉乘,产生一系列的查询项。用查询项对用户输入的查询关键词进行表示。在查询模板生成时,给出一个适合聚集查询的查询结构——查询模板。同时,指定有效的查询模板必须满足一些性质。本文据此设计了一个启发式查询模板生成算法,对关键词预处理阶段产生的查询项,都会形成相应的查询模板。一个查询模板将会唯一地与一个结构化查询相对应,对每一个查询项,都会形成一个查询模板。在查询结果生成时,利用改进的评分规则对生成的查询模板进行评分,选择最优的查询模板生成结果。实验结果表明,本文提出的聚集查询方法具有良好的查询性能,具有有效性和可行性。
其他文献
物流配送是物流活动中一种非单一的业务形式,它与商流、物流、资金流紧密结合,并且主要包括了商流活动、物流活动和资金流活动,可以说它是包括了物流活动中大多数必要因素的一种
无线传感器是由微型电池驱动的设备具有能量有限的特点;在无线传感器网络中包含了大量的无线路由传感器。一旦这些电池安置在这些传感器当中,我们便很难去人为的更换电池,耗尽
移动Ad hoc网是一种多跳的、无中心的、自组织无线网络,又称为多跳网(Multi-hopNetwork)、无基础设施网(Infrastructureless Network)或自组织网(Self-organizingNetwork)。Ad
主机基数定义为一段时间内网络中的某主机链接的其他不同主机的数量,对于主机基数的检测是当前网络测量中的一个重要内容。随着互联网的发展,网络入侵事件频繁发生,如蠕虫病
在录井导向过程中,使用可视化处理技术将抽象数据转化成为直观形象的图件,能够帮助导向师分析地层构造性质,判定目的层的位置,提出合理的导向意见。目前,大部分导向软件对于测井资
基于大数据分析技术,构造新型功能材料信息综合数据平台,提升新材料研发生产设计过程中建模分析、数据筛选和计算效率,是目前是计算机及材料科学研究专家正在研究的热点。同
随着计算机、电子及信息技术的飞速发展,人们之间的信息交流变得越来越方便。海量的多媒体信息通过移动终端自由的传输和存储,由此带来的视觉信息爆炸问题日益严重。海量、非结
在普适计算的环境上,人与情境感知设备的交互应该简单而自然的。然而,在计算机可以融入到我们周围环境、进入我们的日常生活之前,仍然有许多问题需要解决。如果用户不能理解情境
近年来,语义分析已经引起了自然语言处理领域越来越多的关注。随着SemEval2007任务Task19的提出,框架语义抽取任务受到了越来越多研究学者的关注。框架排歧任务是框架语义结
互联网技术的飞跃式发展,促使WWW网络拥有的Web站点和信息资源剧增,面对如此庞大的信息,用户检索的资源虽然变得愈加丰富,但是,搜索引擎检索出的结果有时也难以让用户满意。