挖掘数据流中的频繁项集

来源 :第六届中国Rough集与软计算学术研讨会(CRSSC'2006) | 被引量 : 0次 | 上传用户:zddlcp05030613
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络监测、点击流、电信呼叫记录等许多领域中,数据以流的形式出现.挖掘并分析数据流中的频繁项集是获得数据流中有用信息的一种方法.由于数据流具有无限性和连续性的特点,使得传统的挖掘方法难以适用.挖掘数据流中的频繁项集是当前数据挖掘研究领域的研究热点. 许多研究人员已经对数据流中的频繁模式挖掘进行了广泛的研究.本文利用count sketch数据结构提出了挖掘前k个最频繁的频繁项集的算法.提出了Lossy Counting算法挖掘数据流中的频繁1项集,并对频繁项集的挖掘给出了实践方法.利用Count-Min Sketch数据结构对数据流中数据项进行统计查询.提出了一种新的FP-DS算法.该算法采用分段思想,利用改进的FP-growth算法逐段重建FP树挖掘频繁项集.当数据流中的频繁项集增加较多时,算法的效率下降很大。
其他文献
为了解决多代卫星测高数据之间的不协调性问题,本文基于误差验后补偿理论,提出将传统的交叉点平差整体解法简化为两步处理法,即首先使用条件平差法对交叉点观测方程进行平差
会议
本文基于较原始的基于像数网格点信息模式匹配识别算法的基础上进行,而近年来在数字识别领域的一些新的特征提取和特征的选择方法:例如:穿越次数特征,基于笔画方向的特征,周
会议
目的:通过临床药师对合并机会性感染艾滋病患者实施药学监护的过程,探讨药师在临床治疗中发挥的作用。方法:针对具体病例,协助医师为患者制订有效的治疗方案;为患者建立药历,
目的:了解广东省人民医院国家基本药物的使用现状,并为进一步促进我院国家基本药物合理应用提供依据。方法:对我院2009-2011年国家基本药物品种覆盖率、使用金额比例、用药频
高校在进行本科生毕业论文综合评价工作中,通常要组织一批专家或老师,对每个学生的论文情况按照指标进行打分,再综合得出该学生的论文成绩,并把它作为一条历史数据,录入数据
虽然网页设计者一般将相关内容放在同一页面,但是网页通常包含如广告、导航栏、版权信息等与页面主题关系不大的信息,同时也可能包含多个主题.如果将整张网页作为最小不可分
近期,住房市场“去库存化”远没有完成,一些中心城市的房价飙升,“地王”频显,这种流动性亢奋刺激下的房市“复苏”实在令人担忧。中国的住房市场有着许多先天的不足(土地市
本文提出的主观信任表示方法,兼顾了主观信任的不确定性和模糊性,并基于云模型在信任的定性概念和定量表示之间架起了一座桥梁.把人类语言的软推理机制引入到主观信任的推荐
会议
(一) 中醫學術的發展和中國整個社會的發展是分不開的,中國社會的發展,停留在封建主義社會時期比較長,而封建主義社會的小生産制度最容易養成保守的思想習慣,只重視舊經驗,
目的:评价国家基本药物制度实施后上海市社区卫生服务中心基本药物供应的充分性,为完善国家基本药物制度提供参考.方法:比较上海市实施国家基本药物制度实施前、后城乡样本机