大型数据库重复记录检测与优化研究

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:liuya
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究大型数据库重复记录检测与优化,利用Jaro算法以及TF-IDF算法计算大型数据库不同记录字段相似度量函数,所获取字段相似度量函数作为记录特征向量,经过人工标记后设置为BP神经网络期望输出。构建BP神经网络学习样本,设置变参数量子粒子群初始连接权值与阈值作为粒子,利用BP神经网络依据学习训练样本获取量子粒子群适应度函数值,确定粒子此刻最优位置以及全局最优位置。将全局最优位置粒子设置为BP神经网络初始连接阈值以及权值,重复更新粒子位置,利用所获取训练集学习结果建立大型数据库重复记录检测模型,检测模型输出结
其他文献
传统的旅游智慧平台存在信息少的问题,因此设计一种基于大数据分析技术的旅游智慧平台。根据旅游信息生成、传输、处理和应用的过程,设计基于大数据分析技术的旅游智慧平台模
2013年对于铁路发展历程而言是具有重要意义的一年,2013年3月国务院机构改革方案公布,标志着新一轮国务院机构改革即将开启。撤销铁道部作为其中改革之一,是国企改革的典范和
针对现有语音识别技术识别精准度低的问题,提出一种基于深度卷积神经网络算法与迁移学习相结合的语音识别技术。由于深度卷积神经网络应用范围有限,当输入输出参数发生变化时
针对干式磁选机分选过程中磁团聚引起铁精粉品味严重下降的问题,对气固两相流中的气相采用流体力学方法(CFD)、颗粒相采用离散元法(DEM),建立二维磁选机分选腔数学模型,利用
期刊
针对原有移动学习平台的资源搜索筛选项不够具体,导致资源查找困难的问题,设计基于深度学习的移动学习平台系统。优化系统硬件结构,合理设置电源域管理芯片模式。基于深度学
小学语文教学对整个小学教学有非常重要的影响.语文教学能帮助培养学生的语言组织能力和审美能力.因此,教师需要花费时间进行教学方式的改善,提升教学效率.在当下的小学语文
伴随近年来我国教育体系的不断完善与教学课程的不断改革,小学阶段基础英语教学以逐渐成为我国基础课程改革的主要内容,因此,小学英语教学中对于情景教学方法的运用也得到了广泛
针对原有财务风险管控系统财务计算用时较长的问题,引用云计算法优化其性能,设计基于云计算法的财务风险管控系统。设计装配高精度芯片的适用于云计算技术的计算机主机在为此
针对传统系统受到吞吐量和传输延迟影响而导致评估结果精准度低的问题,提出基于Packet Tracer软件的主动防御网络安全性评估系统设计。在主动防御原理支持下,设计服务器端结