论文部分内容阅读
讨论了在大数据库上挖掘关联规则的抽样算法。挖掘关联规则是数据挖掘的重要问题之一。为了找出关联规则,几乎所有的算法都需要扫描数据库许多遍。在算法分析时,对于大数据库,I/O时间是很重要的因素,且与扫描数据库的遍数有关。所以,减少扫描数据库的遍数,将提高算法的效率。抽样算法能减少扫描遍数。该文给出了一个改进的抽样,比已知的抽样算法效率更高。