【摘 要】
:
如何有效地约简频繁项集的数量是目前数据挖掘研究的热点。对频繁项集进行聚类是该问题的解决方法之一。由于生成子是全体频繁项集的无损精简表示,故对生成子进行聚类与对全体
【机 构】
:
北京科技大学信息工程学院,北方工业大学信息工程学院
【基金项目】
:
国家自然科学基金(the National Natural Science Foundation of China under Grant No.60675030),北京市属市管高等学校人才强教计划项目.
论文部分内容阅读
如何有效地约简频繁项集的数量是目前数据挖掘研究的热点。对频繁项集进行聚类是该问题的解决方法之一。由于生成子是全体频繁项集的无损精简表示,故对生成子进行聚类与对全体频繁项集进行聚类具有相同的效果。提出了一种基于生成子的频繁项集聚类算法。首先,利用最小描述长度原理,讨论了选择生成子进行聚类的合理性;其次,给出了生成子的剪枝策略及挖掘算法;最后,在一种新的项集相似性的度量标准的基础上,给生成子的聚类算法。实验结果表明,该方法可有效地减少项集的数量,并具有较高的挖掘效率。
其他文献
提出了一种使用支持向量机(Support Vector Machine,SVM)的分数等级融合的虹膜识别方法。通过对虹膜纹理采用小波包分解,选择最高能量区域和次高能量区域提取特征向量,与注册入库的虹膜特征向量计算出海明距离。最后融合两个海明距离输入SVM进行识别。该方法减少输入支持向量机的维数。实验结果表明,该法提高了识别率,能够有效地应用到身份鉴别系统中。
通过模拟蟑螂的觅食行为,提出蟑螂算(Cockroach Swarm Optimization,CSO)。算法充分利用了蟑螂社会的平等特性和群体智慧。食物再分配、回巢等策略的使用使算法具有较强的全局搜
1 环比蔬菜产地价、批发价均略涨,零售价平稳.与全国同期同品种均价比较:产地均价明显低于全国,批发均价明显高于全国,零售均价低于全国 1.1 地产蔬菜价格环比略涨第20周(201
摘 要 柑橘属于常绿生长的果树,形状稳定且昆虫类害虫的变动情况较小,柑橘的这些特点,为病虫害的治理提供了一定的便利条件。基于此,通过对柑橘生长状况的研究,保证柑橘健康生長,实现快速增产增收,探析柑橘病虫害的综合防治技术。 关键词 柑橘病;病虫害防治;防治技术 中图分类号:S436.66 文献标志码:B DOI:10.19415/j.cnki.1673-890x.2017.15.007 柑橘作
在不完备信息系统中,通过引入划分贴近度,对不完备信息系统中属性的重要性进行了定义。针对不完备信息表和不完备决策表提出了两个新的基于划分贴近度的属性约简算法,两个算法的
国有企业在岗职工的越轨行为是基于特定的社会情境所作出的一种综合性的选择,是一种社会行为.这种越轨行为产生的原因在于:结构性利益失衡;非正式组织的背反性秩序;价值错位,
藏弦胡是雪域高原藏族特有的拉弦乐器,采用藏区特有的牛角、杜鹃木、羊皮、马尾等材料制成,具有区别其他拉弦乐器的独有特点,是雪域高原上独特的藏族精灵。了解藏弦胡的功能
<正> 胫骨前区症候群,是在胫骨前区由于内压异常增高所致二次性组织损伤时一些症候群.所谓的胫骨前区就是位于小腿的前侧方以胫骨、腓骨、骨间膜、胫前肌间隔及肌膜坚强包围
概述小波分析与重构的基本理论,将小波分解的理论应用于B样条曲线的多分辨编辑中,提出一种小波分析和重构的新算法。该算法利用方程组的增广矩阵为类带状矩阵或者稀疏矩阵这一特点,运用简单的矩阵的行初等变换,将类带状矩阵或者稀疏矩阵化成容易接受的行简化矩阵,解方程组,使小波分解与重构的过程快速准确,使从事相关工作的技术人员更容易理解和接受。
随着气象现代化的推进,我国地面气象观测业务基本实现了自动化监测。但自动化的监测过于依赖自动化的设备,又由于设备所处的环境,极易导致气象检测数据的丢失,不利于气象工作