独立于应用的数据库聚类技术研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:hegang520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大型公司拥有多个子公司,每个子公司一般分布在不同的地区,大型公司一般使用多数据库系统管理业务。多数据库系统的知识发现对于大型公司的管理者是一种迫切的需求。简单地将子公司数据发送到总公司,进行集中挖掘,弊端很多,因此开发一种多数据库挖掘系统是数据挖掘的一个新的挑战。面向应用的数据库选择合并挖掘方法效率低下且容易造成信息丢失;分布式挖掘方法不产生中间规则且平行挖掘算法部署困难。独立于应用的多数据库最优分组挖掘方法针对数据挖掘过程的三个阶段,重新设计了多数据库挖掘的过程:在数据准备阶段加入多数据库最优分组过程;然后单独挖掘每一个数据库,产生本地规则集;在知识表示评价阶段进行模式分析和模式合成工作:模式分析产生高票规则、例外规则和建议规则;模式合成不仅产生全局规则,还产生支持度置信度高于全局规则的分组规则。三个阶段的过程完整彻底地完成了多数据库挖掘任务。本文的研究工作主要包括以下三个方面:(1)总结了多数据库挖掘技术研究的基本情况。包括多数据库挖掘问题的重要性、基本结构和特点;现有的两种多数据库挖掘技术的基本内涵和弊端;数据库间相似度计算方法和多数据库的分组方法;多数据库挖掘中的数据库分类技术。(2)提出一种基于模糊聚类分析的多数据库最优分组技术。该技术较现有的两种多数据库挖掘技术有明显的优势,整体时间性能很高,能够获得更有效的全局决策支持信息。并且该技术在算法设计上有创新,能够对分类数据进行模糊分析。(3)提出分组规则概念,并利用规则合成技术证实了分组规则的优越性。分组规则是分组内的全局规则,它缩小了决策范围,使决策对象更集中,从而降低了成本、提高了效果。
其他文献
聚类分析是数据挖掘的一项重要功能,是数据挖掘领域中一个非常活跃的研究课题。聚类分析既可以作为一个独立的工具来发现数据的全局分布模式,也可以作为其他算法的预处理步骤广
动画是文化产业的重要分支,而三维动画角色作为动画的灵魂,其高效的制作方式却仍难觅获。计算机技术的发展,使得设计师对角色进行模型检索和组合建模成为了可能,而这种快速建模方
传统无线传感器网络中的sink是静态的,这使得距离sink较近的节点由于要承担大量的数据转发工作,能量消耗较快。由于传感器节点通常部署在环境恶劣的区域,且节点使用电池供电的方
手机视频被预测为下一个无线网络端的热点应用。而且,随着移动通讯技术和智能手机的普及,人们对于先进的无线视频广播技术的要求越来越迫切。那么一个问题就自然随着而来,目前存
随着网络信息技术的快速发展,人们对信息安全的需求也越来越高。多媒体信息的获取、编辑和分发越来越方便,这给人们带来便捷的同时,也给传统的信息安全带来了极大的挑战。传统的
“基于DRM的数字内容交易与分发平台研究及应用”结合目前数字出版领域的现状,重点解决数字内容交易与分发过程中的关键棘手问题,通过对相关关键技术的研究,最终建立一个版权保
随着计算机技术的迅猛发展,二维可视化技术已经不能满足人类的需求,三维世界对人类的吸引力起来越大。在三维可视化的研究中,复杂物理过程的可视化正在成为信息可视化领域的一个
在当今的信息化时代,信息的获得、处理和利用已经越来越重要了。人类所获取的信息中,视觉占了70%,因此对图像这种数据类型的获取,处理和利用十分重要。但是,由于成像设备,传输,人为
随着多媒体技术的蓬勃发展,立体图像技术应运而生。相比于二维图像,立体图像额外提供了深度信息,能够带给观测者身临其境的立体感受,因此在娱乐、军事以及工业等种种领域开始扮演
随着计算机视觉领域的不断发展,图像的处理问题越来越受到人们的关注。本课题通过对运动员的滑行数据进行分析找出与高水平运动员之间的差距,以提高运动员的水平。本课题主要分