【摘 要】
:
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的
【机 构】
:
江苏大学信息管理与信息系统系,江苏大学计算机科学与通信工程系
【基金项目】
:
国家自然科学基金项目(70971067);国家科技支撑计划基金项目(2010BAI88B00);江苏省基础研究计划基金项目(BK2010331);博士研究生创新计划基金项目(CX10B_016X);江苏大学高级人才基金项目(08JDG057)
论文部分内容阅读
随着现实待挖掘数据库规模不断增长,系统可使用的内存成为用FP-GROWTH算法进行关联规则挖掘的瓶颈.为了摆脱内存的束缚,对大规模数据库中的数据进行关联规则挖掘,基于磁盘的关联规则挖掘成为重要的研究方向.对此,改进原始的FP-TREE数据结构,提出了一种新颖的基于磁盘表的DTRFP-GROWTH(disk table resident FP-TREE growth)算法.该算法利用磁盘表存储FP-TREE,降低内存使用,在传统FP-GROWTH算法占用过多内存、挖掘工作无法进行时,以独特的磁盘表存储FP-TREE技术,减少内存使用,能够继续完成挖掘工作,适合空间性能优先的场合.不仅如此,该算法还将关联规则挖掘和关系型数据库整合,克服了基于文件系统相关算法效率较低、开发难度较大等问题.在真实数据集上进行了验证实验以及性能分析.实验结果表明,在内存空间有限的情况下,DTRFP-GROWTH算法是一种有效的基于磁盘的关联规则挖掘算法.
其他文献
无线传感器网络中如何获得较低的通信代价同时在事件数据的push和pull之间实现更好的平衡是各种数据分发算法共同追求的目标.分析了目前已公认较好的两种典型的有结构和无结
刘德玉教授认为膝骨关节炎属本虚标实证,肝肾亏虚是其本,经脉不通是其标,而风寒湿侵袭是发病的诱发因素,并非疾病发生的根本原因.其治疗应从虚而治,以滋补肝肾为主,根据外邪
基于DMSP/ OLS 夜间灯光指数和SPOT-VEGETATION 逐旬NDVI 数据构建人居指数,模拟武汉市2000,2012 年人口空间分布.采用空间自相关模型,从时空角度分析2000-2012 年武汉市人口
把双创教育作为一种教学理念,分析数学实验教学与双创教育相融合的必要性和意义。双创教育背景下,以研究性学习为导向,对于数学实验课程的教学设计和教学方法进行了一些探索,
<正> 随着生活水平的不断提高,人们对洗发液质量与功能要求亦越来越高,即不仅要求洗发液能除垢,洗后易梳理,蓬松光亮,而且要能护发、养发、去头皮屑、止痒。但据国内大中城市
<正>中药炮制是指根据中医药理论,按照医疗、调剂和制剂的需要,将中药材进行整理加工,制成一定规格的饮片[1]。中药炮制历史悠久,经过几千年的不断发展完善,已经成为中医药学
本文通过对民国时期影响深远的中医刊物《医界春秋》的分析,总结出中医在这一时期的特点,通过对中医存废斗争和中西汇通主张的论述,探讨了在当时的历史背景下中医发展的特征
接受美学在二十世纪之后受到全球文化的关注,二十世纪九十年代之后,这种文学理论开始兴起。接受美学是对文学的新研究方式,主要研究的对象是读者,以读者的接受为导向进行研究
胡希恕先生善于从方证的角度辨治瘀血证,从病史、症状、体征入手,抓主证,治疗多合用柴胡剂,重视气上冲,并结合病人的体质用药,临床疗效显著。
孵化器作为"大众创业万众创新"的一个载体,在全国普遍受到各级政府和企业的高度重视。由于条件所限,建设主体对孵化器信息化建设的思路不尽相同,不同地区和不同规模的孵化器