【摘 要】
:
频繁项集挖掘是数据挖掘研究领域的一个基本问题,其瓶颈在于频繁项集全集的结果过多,冗余现象严重.主要的解决思路是只挖掘全体频繁项集中有代表性的子集,使得这种子集或者可
【机 构】
:
北方工业大学信息工程学院,北京科技大学信息工程学院,广西师范大学计算机科学与信息工程学院
【基金项目】
:
国家自然科学基金项目(60675030);北京市优秀人才培养资助项目(2009D005002000009);北方工业大学青年重点研究基金项目;北方工业大学博士科研启动基金项目~~
论文部分内容阅读
频繁项集挖掘是数据挖掘研究领域的一个基本问题,其瓶颈在于频繁项集全集的结果过多,冗余现象严重.主要的解决思路是只挖掘全体频繁项集中有代表性的子集,使得这种子集或者可满足应用的需要或者可由它们导出其他项集.最大项集和闭项集便是这类解决方案中两种最典型的子集形式.在最大项集和闭项集的基础上,提出了元项集这一新的频繁项集精简表示方法.首先,证明了最大项集和闭项集都是元项集的特例,且元项集所包含的项集数目介于二者之间;其次,讨论了元项集的性质.最后,通过在闭项集挖掘算法DCI-Closed-Index的基础上引入剪枝策略,设计了一个元项集挖掘算法.实验结果表明,所提出的挖掘算法是有效的和高效的.
其他文献
从免疫学角度,自然妊娠是一种特殊类型的半同种异体移植。母体对胚胎这种“天然移植物”的免疫耐受是妊娠得以建立和维持的内在本质。妊娠失败多与母体免疫调节功能异常对胚胎
建立水土资源限制度模型,定量评价京津冀、长三角和珠三角三大城市群基于人口分布的水土资源限制度及其空间格局,揭示三大城市群的水土资源限制度的差异。研究发现:(1)整体而
拜城矿区某井田由亚吐尔乡煤矿探矿权和润华煤业有限公司润华煤矿采矿权整合而成,原亚吐尔乡煤矿、润华煤矿范围内存在六个小窑,由于没有长远规划,乱采乱掘,现井田范围内存在
煤矿开采与煤场洗选煤操作中,不可避免的就形成大量煤矸石,通常的处理办法是堆放在一起,成为一个矸石山,严重污染了周围环境,同时还会对周围生长的动植物以及居住的民众健康