基于XML的异构数据库挖掘系统的实现研究

来源 :山东大学 | 被引量 : 0次 | 上传用户:jh_fan88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对目前银行存在的多种数据库应用并存的状况,该文提出了一种基于XML的异构数据库挖掘方案,即通过JDBC访问数据库,然后将数据存放到XML文档中,并在此基础上进行数据挖掘.该文重点讨论了以下方面的问题:1.提出了基于XML的异构数据库挖掘方案,将异构数据库中的数据用XML文档的方式表示出来,并在此基础上进行数据挖掘.2.在数据集成阶段,首先将所有数据库的连接参数和查询语句等存放在XML映射文件中,然后通过JDBC接口与异构数据库相连,最后将查询到的结果存放在XML文档中.3.然后对集成的数据进行数据验证.该文采取Schema技术对XML文档进行数据的有效性检测,并对错误数据进行处理,形成有效的文档,作为数据挖掘的基础.4.基于密度和网格的聚类方法.讨论了聚类分析的基本概念和方法.为了对多维数据进行挖掘,该文采用了基于密度和网格相结合的聚类分析方法,并对商业银行持卡人的实际消费数据进行了具体分析,从中找出目前持卡人的年龄、消费额和存款余额的分布情况.5.多维关联分析的算法及应用.介绍了关联分析的基本概念和Apriori算法,并采用XQuery技术进行了实现.然后在聚类分析得到的分布区间上,采用静态多维关联分析方法找出了持卡人的消费额、存款余额和性别之间的关系.论文最后讨论了下一步的研究工作以及有待解决的问题.
其他文献
在网络应用越来越广泛地同时,网络安全也显得越来越重要。为了增强网络的安全性,人们采用了各种网络安全的技术,入侵检测是近些年来人们提出的一种新型的主动防御机制,并成为网络
本文通过作者实际参与的日本最大的民间组织“伦理法人会”的管理信息系统的项目开发,论述了利用网络原理、数据库技术、软件工程技术进行系统分析、系统设计和开发的理论和方
学位
认证加密算法是能够同时保护数据机密性、完整性以及数据源认证的对称密码算法,在现实生活中有着广泛的应用需求。随着CAESAR竞赛的展开,认证加密算法的分析与设计成为了密码学
该文从中国、中国人民解放军气象装备和通信条件的实际情况出发,重点研究探讨了天气雷达组网、雷达信息压缩传输和多种型号雷达信息的同化处理技术,为天气雷达组网拼图的实现
自动推理是一门在给定知识及有关推理策略的前提下,研究用计算机帮助人们进行推理的学科.多种类逻辑及多种类谓词演算是经典一阶逻辑及其演算的重要拓展,并已经在计算机科学
该文提出了一种相类似的新算法——使用色彩与视差空间信息的SCADI(Segmentation of Colorand Disparity Information)分割技术,它由多帧平均的FAS(Frame AverageSegmentatio
近年来,随着大数据环境的快速发展,数据处理集群的规模在不断增长。目前由几千台服务器组成的数据处理集群已非罕见,部分领军企业的集群甚至包含上万台服务器。在这些大规模集群
信息安全是指如何防止计算机和通信系统中的数据被非授权泄漏和篡改的科学和研究方法.密码学理论和密码技术是信息安全的一个重要组成部分.它涉及到许多学科,诸如数学、计算
近些年来,伴随着人工智能领域的浪潮,机器人越来越多地出现在我们的日常生活中,与我们的生活紧密相关,例如足球机器人、无人车、无人机等。这些机器人虽然不是安全攸关系统,但是一