基于深度学习的大规模数据库重复记录删除研究

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:poilkjqwe123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重复记录直接影响数据库管理的效率,当前重复记录删除的正确率低、误删率高,为了提高重复记录删除的正确率,满足重复记录管理的要求,提出基于深度学习的大规模数据库重复记录删除方法。首先对已有数据库重复记录删除方法进行分析,找到引起数据库重复记录删除不理想的因素;然后采用深度学习算法对数据库重复记录数据进行学习,建立数据库重复记录的分类器,根据分类结果进行数据库重复记录删除操作;最后通过仿真实验分析数据库重复记录删除效果。结果表明,深度学习算法可以对数据库重复记录进行准确分类和识别,获得较高的删除正确率,误删率明
其他文献
目的探讨撬拨复位联合空心钉固定术在老年难复性股骨颈骨折治疗中的应用效果。方法选取2015年9月至2019年9月南方科技大学医院收治的难复性股骨颈骨折患者34例。根据随机数字
为了提高视频画面目标检测和跟踪的速度,缩短目标跟踪的时间,提出基于机器视觉技术的视频画面目标检测和跟踪方法。基于机器视觉技术的分析,将机器视觉技术引入到视频画面目标的检测和跟踪中,通过视频画面与前一帧视频画面做像素差分运算,得到了二值差分视频画面,并利用阈值的调整,完成视频画面目标的检测;最后依托Camshift跟踪算法流程,得到了视频画面目标的颜色概率分布图,完成了视频画面目标的跟踪。实验结果表
活性炭因有较大的比表面积和经济易得性,常作为气体吸附法净化气体的吸附剂。SO2是大气环境质量指示的一个重要大气环境因子,其排放被严格控制。SO2的吸附受多种因素影响,本
病毒活性及病毒气溶胶粒径是病毒空气传播实验中的重要影响因素。病毒活性主要与环境温湿度有关。为了研究负压隔离器内颗粒粒径的影响因素,测量了实际运行工况下的两种粒径
智能建筑空间网格结构造型设计是总体空间结构视觉设计的关键环节。采用AutoCAD软件设计智能建筑空间结构,将ObjectARX作为AutoCAD软件的二次开发工具,通过排样数据的生成优化以及排样数据向图形转换并绘制实现AutoCAD软件的二次开发。在二次开发的AutoCAD软件中通过前处理模块输入智能建筑空间网格图形、支座以及节点荷载,形成总体数据文件,内力分析及设计模块利用该文件实行计算。得到智
儿科疾病常与脾胃相关。《素问·太阴阳明论》[1]中:“脾者土也,治中央,……脾藏者,常著胃土之精也,土者,生万物而法天地,故上下至头足,不得主时也。”清代唐宗海在《血
大量的充电桩接入电网引起了谐波问题,严重影响了电网的电能质量,为了给谐波补偿提供可靠的依据,能够快速准确地检测出注入电网的谐波含量是非常必要的。首先对充电桩注入电
目的探讨益气活血汤加味治疗肾病综合征(nephrotic syndrome,NS)的临床疗效。方法选择2017年1月至2019年1月河南大学第一附属医院收治的NS患者96例,依据抽签法将其分为观察组
为有效提升医院人力资源管理工作效率,同时有效降低医院在人力资源方面的成本投入,提出一种基于主动数据库的人力资源管理系统设计思路。充分运用主动数据库技术优势,经触发
基于RTDS实时仿真平台,建立采用双SVPWM换流器的微型燃气轮机发电系统的仿真模型,系统电机侧采用电压电流控制,控制直流侧电压稳定;电网侧采用PQ双闭环控制,控制微型燃气轮机