关系数据库关键字语义近似查询方法研究

被引量 : 2次 | 上传用户：connie1234

【摘要】

：

随着互联网的普遍应用和网络数据的急剧膨胀,数据库在线关键字检索方式已经成为人们网上查阅和搜索信息的主要手段。然而面临当今数据组织形式和结构的各异性,研究者已经指出

【作者】

：

崔婉秋

【发表日期】

：

2016年01期

【关键词】

：

检索耦合关系分析 Top-k推荐查询重构近似查询

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网的普遍应用和网络数据的急剧膨胀,数据库在线关键字检索方式已经成为人们网上查阅和搜索信息的主要手段。然而面临当今数据组织形式和结构的各异性,研究者已经指出了需要采取不同的数据建模形式(如关系、层次、面向对象的、网状、半结构化模型等),进而也引起了大量新颖的数据管理技术的不断发展(如对于XML数据、数据流的处理、网络数据的集成、数据分析及挖掘等)。关系型数据库因其数据结构简单、清晰,且具有较高的独立性和安全保密性,已成为应用最广泛的通用型数据库,且作为Deep Web的重要组成部分,因此关系数据库检索技术应具有更高的用户友好性和通用性。数据库管理系统提供复杂的工具,可使专业用户使用SQL语言进行结构化查询,但对于大多数普通用户来讲,像谷歌、雅虎等搜索引擎那样通过提交几个关键字就能检索到相关信息的关键字查询方式,更容易被其接受和使用。然而由于非专业用户的表达查询意图的方式和检索时所关注的差异、以及对相关数据库存储内容了解的有限,导致许多数据库信息无法被获取,用户的满意程度下降,且进行试探性检索的次数会随之增加。因此针对检索的方式、手段和技术需要不断完善,使其能够对与查询关键字语义相关(但不是明确给出的关键字)的内容给出查询结果,提高查询的准确性,以便更好地向人们提供简单、可依赖的信息获取服务。本文首先提出一种评估数据库中所有存储的数据与用户给定查询条件的关键字之间的语义相关性,即分析词条之间耦合关系的方法TCR(Term Coupling Relationships)。根据TCR评估用户初始条件中的关键字与数据库中全部数据的耦合关系(包括内耦合与外耦合两部分),并生成相关性大小的顺序列。然后利用排名机制将数据库中Top-k排名结果作为候选关键字推荐给用户,最后通过用户重构最贴近自己意图的条件提供给检索系统进行再查询。其中查询重构系统选取基于候选网的DISCOVER系统进行再查询处理,即将TCR方法集成到传统的精确查询系统中。嵌入TCR方法的检索系统,能够使缺乏相关经验的用户根据系统分析初始条件并推荐出相关性高的关键字,使用户能够重构符合自己需求的查询条件,在某种意义上实现了对初始目的的近似查询。并且让用户自己主观的重新构建和选择关键字,使检索更加人性化,更能满足用户的真实想法。同时结合了精确匹配的优势,使检索效率及用户满意程度达到较高的要求。实验采用DBLP、Movie Lens和IMDB数据集,应用TCR算法在关键字与数据库中的信息进行耦合关系分析,证明了参数α对不同数据库的不同影响。并用Top-k推荐算法返回推荐关键字。近而在DISCOVER系统上实现关键字的最终查询。

其他文献

宜春市城乡中学田径教学开展现状与发展对策研究

本文主要采用文献资料、问卷调查、专家访谈等研究方法,根据我国基础教育课程改革和城镇一体化建设的总体要求,结合我国中学体育与健康课程新的课程基本理念,通过对宜春市城

学位

城乡中学体育教学田径体育设施

广告模式的选择

商品的广告效应通常是轰动一时，然后降为展品的日常宣传，这种状况不会发生变化，即使不断增加广告投入。广告商品实际上总是存在着“过时”的客观反映，但人们做广告的模式通常不考

期刊

广告模式

视听新媒体新闻寻租的治理——以网络股评信息为例

十八大以后,反腐浪潮日益高涨,权力寻租慢慢进入人们的视野,随着互联网的发展,权力劝阻也渗透到了网络电视和互联网电视等媒体行业,即使是在目前具有极大成长空间的视听新媒

期刊

视听新媒体新闻寻租网络股评寻租危害规避措施

钢桥面板顶板-纵肋连接接头的疲劳性能

对钢桥面板整体模型进行了有限元分析。结果表明,顶板横向应力在横桥向的分布表现出类似弹性支承多跨连续梁的受力特点,且顶板横向应力基本全部为弯曲应力,膜应力很小,在顶板

期刊

桥梁工程疲劳性能有限元方法正交异性钢桥面板顶板-纵肋连接接头设计规范

新《环境保护法》对企业的影响及对策分析

新《环保法》贯彻了中央关于推进生态文明建设的要求,是现阶段最有力度的《环保法》,将于2015年1月1起开始施行。本文对新《环保法》的特色及其关联政策进行分析,并对企业的

期刊

新《环保法》关联政策影响建议

电视专题片的细节描写

电视专题片作为电视节目的一项重要内容,它具有多样化的表现形式、丰富的内容以及深刻的寓意。电视专题片中的故事情节和画面感染力是评价电视专题片质量好坏的重要因素。一

期刊

电视专题片细节描写感染力

智能家居企业营销对消费者购买意愿的影响研究

20世纪80年代出现了智能家居思想,1984年,世界上第一幢智能建筑落户在美国的康涅迪格州。近年来,人工智能技术的成熟及互联网和物联网的普及催动传统家居产业的改造升级。智

学位

企业营销心理距离购买意愿智能家居

商业银行处置不良资产法律问题研究

随着商业银行在我国的信贷业务的不断发展,商业银行不良资产也呈现出迅猛扩张的趋势。尤其是在上世纪末,在亚洲金融危机的促使下,我国商业银行的不良资产在短时间内大量涌向

学位

不良资产处置商业银行经济法对策

论《西游记》中孙悟空哭泣的多重意义

本文从孙悟空的哭泣这一贯穿全书的人物动作入手,通过分析哭泣在体现"心猿"复杂性中的意义及哭泣在孙悟空性格发展与形象塑造中的意义两方面的内容,从而能够对神魔小说《西游

期刊

孙悟空哭泣多重意义

化工行业上市公司资本结构影响因素研究

本文用沪深A股2002～2005年间共546条化工行业上市公司的数据，分析了这一行业资本结构的影响因素。实证结果表明：速动比率、成长性以及公司规模均与资产负债率负相关。

期刊

化工行业上市公司资本结构

关系数据库关键字语义近似查询方法研究

与本文相关的学术论文