【摘 要】
:
针对大型事务数据库中频繁集的多属性聚类问题,提出一种高效的频繁集聚类算法.以往聚类算法采用基于距离的计算方法,由于受到属性数据的制约,在频繁集挖掘中具有一定的限制.
【基金项目】
:
国家科技部"十五"攻关项目(2004BA72lA05)
论文部分内容阅读
针对大型事务数据库中频繁集的多属性聚类问题,提出一种高效的频繁集聚类算法.以往聚类算法采用基于距离的计算方法,由于受到属性数据的制约,在频繁集挖掘中具有一定的限制.在属性聚类基础上,基于连接对频繁集进行聚类.在算法中先找出数据点的邻居和计算相似度,构造邻居矩阵;然后计算连接数目,确定邻居数目矩阵;最后通过设置判定函数和阈值确定聚类数.通过实验证明,算法能够不仅能有效地完成频繁集的多属性聚类问题,而且还可以进一步发现频繁集在某一层次的相关性.
其他文献
在Dan.butnriu构造的可知Fuzzy测度和张广先生建立的Fuzzy极限和Fuzzy距离理论基础,提出了一类Fuzzy集合上广义Fuzzy数值则度,广义了定义Fuzzy数值测度的正、负集,探讨了二者的
在图象工程中,图象处理、图象分析、图象理解作为其研究的三个重要层次,图象处理是图象目前发展的主体技术。图象的灰度处理作为图象处理的最基础理论之一,本文探讨了通过读取数
通过对地应力实测资料的分析,论述了套芯法地应力测量中产生钻孔轴向主应力偏高现象的原因,提出了克服此类现象的针对性措施。
针对某市建立局域网和广域网相结合的综合性医疗保险网络系统的用户需求,我们采用面向对象技术的螺旋迭代增量项目开发方法,从主机系统的设计、网络系统的设计到数据库系统的
采空区气体模糊渗流问题由模糊偏微分方程所描述.模糊微分方程是未知函数及其导数与已知模糊函数或者模糊常数的条件等式,方程解的模糊性是由已知模糊函数或模糊常数所引起的
对煤岩变形及破裂过程中得到的电磁辐射信号进行进一步的研究分析表明,电磁辐射信号符合很好的统计分形规律,在受载煤岩的变形及破裂过程中,电磁辐射信号基本现逐渐增强趋势,这对
针对工业上广泛使用的温控仪的工作特点,研究了模糊控制的方法,主要包括:在分析总结模糊控制本质思想的基础上,提出了一种非线性、变权、控制规则自调整的模糊控制器,仿真结
灰色聚类法是将得到的分散的信息,通过白化函数生成灰色聚类矩阵进而对研究对象分类。以阜新市矿井地下水水质评价为实例,采用灰色聚类分析方法对阜新市矿井地下水的监测数据进
根据矿井通风系统的工作特点,采用适用于非线性时变系统的神经网络方法对煤矿主扇风机进行实时控制.介绍了煤矿主扇风机的控制原理,提出了求解全局最优解的神经网络学习方法-