【摘 要】
:
该文首先探讨了数据挖掘的基础理论,简述挖掘系统的开发标准和其体系结构的演进过程;然后讨论了描述软件体系结构的"4+1"视图,并给出几种主要的体系结构风格.基于对数据挖掘
论文部分内容阅读
该文首先探讨了数据挖掘的基础理论,简述挖掘系统的开发标准和其体系结构的演进过程;然后讨论了描述软件体系结构的"4+1"视图,并给出几种主要的体系结构风格.基于对数据挖掘和软件体系结构的研究,该文提出数据挖掘系统的三层体系结构模型:用户接入/中间层服务器/数据层.其中中间服务器可细化为挖掘引擎、任务解析和资源调度三个功能模块.此外,还从动态角度给出一个挖掘任务的行为处理流程:设定任务—提取任务和逻辑解析—资源绑定—资源执行—语法树还原—挖掘结果展示.接下来的部分重点探讨了挖掘系统的数据基础问题.基于对挖掘仓库的建立原因及其特征的研究,该文提出建立数据挖掘系统的数据存储体—挖掘仓库的思想,并建议了仓库中的两种数据组织方式.对于挖掘仓库中的数据管理,具体从驱动策略、数据同步和数据生存期维护三个方面进行阐述.文末还针对数据预处理以及其中的消除不一致性数据问题进行了理论研究和实验验证.
其他文献
随着计算机网络技术的飞速发展,特别是自INTERNET技术为全世界广泛应用以来,社会信息流通能力得到了迅速提高,在很大程度上推动了整个社会的发展.中国虽然起步较晚,但发展速
本文在不确定时间点的时态关系基础上给出了不确定时间区间的定义和“同时”时态关系。由于病历数据的特点和关联规则挖掘的要求,采用附加约束并包含复合项的DHP算法,结合不确
软件测试是软件开发周期中重要的一环,用于检测软件存在的故障和缺陷,是保证软件健壮性和安全性的主要途径之一。随着软件的复杂性和规模的增加,软件测试的开销也进一步上升,自动
面对海量的信息,人们已经无从选择。信息开始从用户主动获取演变成系统根据用户的需求和喜好进行个性化推荐,推荐系统应运而生,并迅速得到广泛研究和应用。协同过滤的算法是目前
生物界中昆虫或动物的迁徙行为对于种群的生存有着至关重要的作用。为了维持物种的生存与稳定,生物界一些群居动物有着严格的等级制度和职责分工。这种严格的等级制度,确保了个
创建逼真的三维人脸模型是计算机图形学领域一个极富有挑战性的课题。随着虚拟现实、影视制作、游戏娱乐、可视电话等应用的发展,这一研究领域越来越受到人们的关注。本文主要
随着信息技术的不断发展和企业竞争的加剧,数据挖掘越来越多地应用于企业的生产和管理中。这一趋势的持续和企业数据的膨胀,只靠传统的单机已难以胜任,此时采用并行处理技术是解
流媒体是一种在网络上实时流式传输的连续时基媒体用户可以一边下载一边对接收的部分数据进行播放流媒体应用涉及实时技术多媒体技术高吞吐量存储技术高速网络技术通信技术等
随着社会的发展,技术的提高,全世界范围内的各个企业都在经历一场深刻的变革。企业开发市场面临的主要任务不再是不断追求产品的质量了,这从技术上已经没有任何问题了。任何企业
电子商务是20世纪90年代初期在美国等发达国家兴起的一种崭新的企业经营方式,它是一种通过网络技术的应用,快速而有效地进行各种商务活动的全新方法。电子商务给人们带来方便的