论文部分内容阅读
在关联规则的评价中,对评价参数的度量是参数在数据库上的平均分布,无法刻画参数在数据库的局部分布;另一方面,评价参数也是有限的。为解决上述问题,首先给出评价关联规则的五个参数及参数选取的原因分析;然后给出分库方案及其分库上的挖掘算法,通过分库挖掘算法获取各参数在分库上的参数值。对获取的参数值,利用扩散原理计算参数在数据库上的分布,通过分布实现对规则的评价和取舍,从而实现关联规则的自动评价和取舍,以及最大程度的自动知识获取,并具有实时查询特性。