【摘 要】
:
高平均效用项集挖掘因其平衡效用而受到数据挖掘领域的关注,它不仅考虑到项集的利润和数量,而且还考虑到项集的长度。本文提出了一种基于效用累加求和上界的高平均效用项集挖
论文部分内容阅读
高平均效用项集挖掘因其平衡效用而受到数据挖掘领域的关注,它不仅考虑到项集的利润和数量,而且还考虑到项集的长度。本文提出了一种基于效用累加求和上界的高平均效用项集挖掘算法HAUIM-GMU。对于该算法,我们首先将典型的最大效用和平均效用上界从项目推广到项集,并讨论了其合理性;然后,基于支持度的概念,提出了一种新的剪枝策略;最后,对算法进行了详细的描述。在真实数据集和合成数据集上的大量实验表明,该算法具有良好的性能。尽管近年来针对高平均效用项集挖掘任务设计了多种算法,但确定合适的最小平均效用阈值来有效并精确控制挖掘结果仍是困难的。受Top-K频繁项集挖掘和Top-K高效用项集挖掘的启发,本文提出基于交叉熵方法的Top-K高平均效用项集挖掘算法,其中K是要挖掘的高平均效用项集的期望数目,而不是常规设置的最小平均效用阈值,该算法无需设计提高内部最小平均效用阈值和减小搜索空间的各种有效策略,采用组合优化的方法解决Top-K高平均效用项集挖掘问题。实验结果表明,该算法是一种高效、节省内存消耗的算法,能够发现大多数实际的Top-K高平均效用项集。在以往的高平均效用项集挖掘研究中,效用项集的价值皆被认为是正值。但是在一些实际应用中,项集效用可能为负。因此,发现具有负效用值的高平均效用项集对于模式挖掘具有重要的意义。本文提出了一种新的挖掘方法:考虑负效用的高平均效用项集挖掘算法。该算法改进提升了HAUIM-GMU算法,从而大大减少挖掘高平均效用项集的执行时间,以较少的内存有效地挖掘所有考虑负效用的高平均效用项集,满足了挖掘具有负效用值的高平均效用项集的时间和空间效率的关键要求。通过实验评估表明,该算法高效可行。
其他文献
近几十年来,随着人类社会的不断发展,环境污染和能源短缺问题日益加剧,我国作为能源消耗大国,对新型清洁可替代能源的开发显得尤为迫切。燃料电池可以将储存在燃料和氧化剂中的化学能转化为电能,且其唯一副产物为水,是一种结构简单、腐蚀性低、高效清洁的绿色电源。尤其是近年来碱性阴离子交换膜(AEM)技术的发展,避免了传统燃料电池碱性电解质碳酸化的问题和酸性电解质中阴极氧还原反应(ORR)反应速率缓慢且不能使用
大气水汽是形成降雨的主要因素,研究大气水汽对降雨的形成意义重大。由于常规探测大气水汽的方法在时空分辨率上有所不足,严重制约了对大气水汽的时空变化特性的认识。随着GP
液滴凝结是自然界中最常见的物理现象之一,被广泛的应用于环境除湿、工业发电和海水淡化等领域。因基底润湿性的不同,主要有膜状凝结和珠状凝结两种凝结模式,后者比前者拥有更好的传热能力。为提升凝结效率,人们在不同材料和经过物理、化学处理的硬基底上进行了大量的凝结研究。然而,却鲜有软基底上的液滴凝结实验。而且,以往对凝结的研究主要保持在同一湿度下,不同湿度对凝结过程的影响还不清楚。此外,在液滴凝结的过程中,
近年来,信用卡预授权交易方式逐渐发展起来,预授权这种新型的交易方式不仅为消费者提供了便利,也为交易的顺利进行提供了保障,为金融市场的发展提供了动力。但由于现行法律法
深海管道维修技术复杂、工程风险大,成本高,在实施现场安装之前,对操作人员进行有效的培训一直是一个亟待解决的难题。海底管道维护维修虚拟现实仿真技术可以为深海油气管道
随着网络平台的发展,推荐系统作为用户与产品沟通的桥梁得到了广泛的关注。协同过滤推荐模型在商业推荐中十分流行,主要通过分析用户与产品的交互数据,建立推荐模型来预测用
近年来,随着我国社会经济飞速发展,社会产业升级和经济结构调整不断加快,现代职业市场亟需大批高素质应用技能型人才。新建本科院校作为转型培养应用型人才试点主阵地,在应用
在全基因组关联分析中,由群体分层、家系结构和亲缘相关性所导致的关联检验统计量膨胀增大了数量性状基因定位的假阳性率。目前流行的做法是用基因组控制去度量和校正群体结构和其他混杂因子的影响。基因组控制方法很多,如群体分层检测、遗传祖先推断、基于家系的关联检验和混合模型关联分析,而且各具优势。相比之下,混合模型关联分析方法更加综合和有效。如今,高效率、低成本的全基因组重测序技术能够产生几乎全部的多态性标记
近几十年来,锂离子电池(LIB)技术的发展和进步极大地改变了人们的生活。然而,由于锂源的有限性,导致锂离子电池价格上涨以及锂源的可持续性,无法满足大规模储能体系的需求,因此,需要研发性能优异,价格低廉的二次储能电池。由于钠在地壳中含量丰富,并且具有与锂离子电池相似的化学性质,因此,钠离子电池(SIB)被认为是二次储能电池的最佳候选者。磷基材料具有优异的储钠能力,是理想的钠离子负极材料。但在实际应用
表面等离激元(Surface Plasmon Polariton,SPP)是在纳米尺度将物体光学和电学性质相结合的新型研究方向。基于表面等离激元原理的纳米材料和光电纳米器件在不同领域被广泛研究和应用。金属纳米颗粒的局域表面等离激元共振(Localized Surface Plasmon,LSP)引起的散射增强,局域电磁场增强等特征可以实现多种不同功能的光电器件。然而利用局域表面等离激元热效应引起的