基于分布式倒排索引的频繁项集挖掘

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ybingh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁项集挖掘是关联规则挖掘中的核心,其直接影响了频繁项集的产生效率。针对Eclat算法在挖掘海量数据中的频繁项集时存在的内存和计算资源不足等问题,文中设计了通过分布式倒排索引实现频繁项集挖掘的DiiEclat算法。倒排索引等同于将数据垂直分布,按事务编号的不同将倒排索引分布式地存储在不同的索引节点上,每个节点上的事务分别做交集,最后由检索代理合并交集结果。在chess、mushroom、T40IIOD100K和T1014D100K数据集上,对DiiEclat、Eclat、Diffset等算法进行了实验对比
其他文献
近年来,我国农村经济得到了快速发展,推进了新农村建设,在此过程中离不开金融的支持。农村金融支持主要包含政策性、合作性、民间性以及商业性等几个方面,但由于受一些因素的
公立医院由于其公益性质,本文从可行性、必要性阐述了可以合法合规地接受社会公益事业捐赠。对医院如何合规合法接受捐赠提出了管理办法和流程,从加强内控建设的角度做好平时
随着职业院校的规模不断扩大,管理工作也愈发受到考验。其中,固定资产内部控制管理又极为关键,对保障职业院校固定资产的安全与完整有着重要作用,为教学以及各项管理工作的开
行政事业单位的国有资产数额庞大,如何对其进行规范的管控,关系着国家经济运行、社会资源配置等重要问题。本文结合行政、事业单位国有资产管理暂行办法,尝试从行政事业单位
无线传感器网络以其低成本、低功耗、易部署等优势广泛应用于各个领域。在工业环境中,对信号传输的实时性和可靠性要求非常高,但是目前的无线传感器网络主要工作在分布式系统下