基于关系数据库关键词检索技术的优化研究

来源 :沈阳航空航天大学 | 被引量 : 1次 | 上传用户:yijun5802382
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的来临,数据库中存储的数据量不断地增加,关系数据库关键词检索技术得到越来越广泛的应用。传统的对于数据库的访问需要用户掌握专门的数据库查询语言以及底层的数据库模式结构,并且在查询过程中往往用户需要的结果是多个表进行连接操作得到的,这时的查询具有很高的复杂性及难度,因此对于基于关系数据库关键词检索技术的研究一直具有很高的热度。传统的关系数据库关键词检索系统在对用户输入的关键词进行查询时是使用完全匹配的方式进行的,因此查询过程中可能会丢失用户期望的结果,造成反馈给用户的结果精度较低;同时,检索过程中存在大量冗余结构的候选网络,造成检索的效率较低。针对传统的关系数据库关键词检索系统中存在的精度低和效率较低的问题,本文提出了带有词性标注的关键词检索算法PT-CNS(POS Tagging-Candidate Network Score)。本文的具体工作和贡献如下:(1)关键词的词性获取针对检索过程中没有考虑用户查询侧重点导致的精度较低的问题,本文通过词性标注工具对关键词的词性进行获取,将生成的包含关键词的元组集合按照词性进行划分。(2)关键词词性的权重分配为了对不同词性关键词对检索结果影响的分析,本文使用逻辑回归的方法对不同词性的关键词赋予权重,并对逻辑回归模型的有效性进行了评估,最终生成带有词性标注的包含关键词的元组集合,以此作为对候选网络进行评分的基础。(3)结合关键词词性的候选网络评分算法首先,针对传统的关系数据库关键词检索系统中存在大量冗余结构的候选网络导致查询效率低的问题,本文提出了基于合并网络查询方法的候选网络筛选算法,去掉候选网络中重复的结构并利用标注好的词性对候选网络进行评分。其次,由于用户期望的结果往往产生在少数候选网络中,因此本文提出了基于贝叶斯网络概率模型的候选网络评分算法,它使用贝叶斯概率模型对候选网络进行评分并结合消除冗余过程中得到的评分得到候选网络最终得分,并生成元组连接树,在数据库中进行查询从而得到结果返回给用户。通过在真实数据集上进行的广泛的试验,本文提出的算法相较于传统的关系数据库关键词检索系统的效率和有效性均有所提升。
其他文献
随着我国科教兴国和人才强国战略的实施,高校对学生学习能力和创新精神的培养越来越受到重视。在高校进行化学史教育,能够激发学生的学习兴趣、学习积极性和创新能力,对适应
自石墨烯被发现以来,二维材料由于其特殊的结构及特性引起了科研工作者们的关注。作为二维材料家族的新成员,二维超薄过渡族金属碳化物(TMCs)的结构特点及优良的物理、化学性质
《义务教育语文课程标准(2011年版)》明确提出,在语文学习过程中,要让学生养成良好的语文学习习惯,初步掌握学习语文的基本方法。一年级是学生形成各种习惯的最佳时期,在这一
我国银行业不良资产的现状我国经济发展进入新常态以来,商业银行不良资产余额和不良率持续双升,这是“三期叠加”风险不断释放的结果,既有短周期的景气下行与长周期的经济增
古莲花池始建于公元1227年,原名“雪香园”。明代,因池中荷花经久不衰而得名“古莲花池”。清代,曾作为乾隆、嘉庆、光绪三朝的行宫和慈禧的行宫御苑。清乾隆年间形成著名的“莲
便携式电子设备和电动汽车技术的发展使得锂离子电池(LIB)产生了巨大的市场需求,与其他电池体系相比较,锂离子电池具有更高的能量和功率密度以及更长的循环寿命。硅(Si)因其
在深化课程改革过程中,邹平县把准"立德树人"脉搏,严格落实课程方案,开齐开足国家课程;坚持一校一品,构建各具特色的课程体系;坚持"四位一体",优化育人环境;立足课堂,把"立德
俄罗斯官方与智库互相配合,有计划有步骤地提出了"大欧亚伙伴关系",智库在其中发挥了桥梁和引导的作用。"大欧亚伙伴关系"具有"二轨外交"的特点。从"大欧洲"到"大欧亚"的历史
<正>相对于外贸进入"规模增长、增速放缓"的新常态,跨境电商则增速迅猛,成为新常态下我国外贸增长的新动力。在高速发展的同时,跨境电商企业面临着大数据运用能力较弱、产品
在雾、霾、雨等特殊天气条件下,大气中悬浮的大量微小水滴、气溶胶微粒等混沌介质会对光波产生严重散射作用,致使光波能量大幅衰减,从而导致成像过程中场景信息被严重削弱,影