基于剪枝概念格模型的频繁项集表示及挖掘研究

被引量 : 0次 | 上传用户:wanggang34320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining)是涉及人工智能和数据库等学科的一门新兴交叉性学科。在当今数字化时代,各种商业、政治、科学数据库和数据量的急剧增长,远远超过了人类目前已有的分析和理解能力。因此,从大量数据中智能地、自动地提取出有价值的信息,即对数据库进行知识的挖掘,具有十分重要的理论意义和现实意义。作为数据挖掘的一种重要模式,关联规则一直受到广泛的关注。发现频繁项集是关联规则挖掘的关键步骤。然而,大多数频繁项集求解算法因需要产生大量候选集而降低了效率。本文将具有完备特性的概念格模型引入到频繁项集挖掘的研究,主要研究内容如下:1.提出了基于概念格模型的项目集表示和求解方法。研究表明,每个项目集一定作为概念格中某个概念的内涵或内涵的子集出现,借助于概念之间的关系可从每个概念导出多个项目集,因此,概念格中概念的数量比事务数据库中项目集的实际数量有显著的减少。2.提出了基于剪枝概念格(Pruned Concept Lattice,PCL)模型的频繁项集表示和求解方法。利用概念间的关系性质,在不丢失信息的同时能有效压缩频繁项集的规模。在此基础上提出基于PCL模型的频繁项集求解算法,该算法基于Apriori性质,在构造过程中及时、动态地剪枝,删除与频繁项集求解无关的概念,从而有效地改善了频集挖掘算法的时空性能。实验证实了算法良好的性能。
其他文献
背景与目的:原发性肝细胞肝癌是一种常见的恶性肿瘤,适合手术治疗的患者只占一少部分,具有较高的复发率,预后很差,严重威胁着人类的健康。人类肿瘤相关性抗原以及肿瘤抗原基
随着我国国民经济的快速发展和科学技术水平的整体提升,在建筑领域,高层与超高层建筑如雨后春笋般涌现。随着建筑高度和难度的增加,各种超高层建筑施工技术应运而生。超高层
中国共产党是按照马克思列宁主义建党理论和建党原则建立起来的工人阶级先锋队组织,是广大党员按照自愿的原则结合起来的,为着共同的理想和目标而奋斗的组织。从建党的那天起
本文以“方”及语素“方”参构词作为研究对象。首先对“方”的语义作以分析;然后分别在空间语义场,宗教语义场和道德语义场中,对“方”参构词的语义内涵予以考察;同时,分别着
为研究成本法和收益法在我国海域价值评估中的实际运用,论文选取了山东省荣成市一宗海带筏式养殖海域为案例,利用成本法和收益法详细测算了该宗海域的价格。研究表明,成本法
探讨身体锻炼自我效能感对体质健康问题突出大学生体育锻炼参与度的作用机制,即身体锻炼自我效能感是否会通过目标自我一致的中介作用,对体质健康问题突出大学生的体育锻炼参
为了检测电气化铁路供电系统中的谐波、无功和负序电流 ,提出了两种基于FBD法的实时检测方法 :直接法与间接法。直接法的特点是 :根据电网电压的波形分析电流 ,使功率电流的
现浇式夹芯保温墙是一种新型保温节能的建筑形式,具有自重轻、热阻大、保温和抗震性能好等优点。但此类墙体仍存在着施工工艺繁琐、结构复杂、施工质量不够理想等缺点,针对这
为给多跨连续拱桥加固改造施工监控工作提供指导,文章以藤县西江大桥为工程背景,借助有限元分析方法,详细阐述了多跨连续拱桥加固改造施工监控系统的建立和控制技术。实践表明:藤
内置缓存是命名数据网络的关键特征之一,为实现节点缓存的高效利用,基于局部流行度,提出一种新的分布式协作缓存策略。通过对用户接入节点进行周期性地统计内容请求速率,并将