数据流频繁模式和分类挖掘算法研究

来源 :浙江工商大学 | 被引量 : 0次 | 上传用户:jvict
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,数据流广泛出现在多种应用领域中,如传感器网络、股票分析、网络故障监测等,与传统数据不同,数据流具有大量、快速连续到达、要求快速响应、一次扫描等特点,因此传统的数据挖掘技术不能直接应用到数据流上。利用有限系统资源对数据流进行快速处理以获取有用信息,为数据挖掘及其应用研究带来了新的机遇和挑战。本文主要对滑动窗口模型下的数据流中频繁模式和分类挖掘算法进行了研究。 首先,对传统的数据挖掘相关理论和经典算法进行了深入分析,尤其是频繁模式挖掘算法Apriori、FP-Growth算法和决策树分类ID3算法,并取其之长运用到数据流相关任务的挖掘上,并一一编程实现,深化对算法的认识。 然后,对数据流的特点及其三种模型进行系统研究,其中滑动窗口模型最符合真实应用,并在静态挖掘算法的基础上加以吸收创新,设计并实现滑动窗口模型下适合数据流的单遍扫描算法一频繁模式挖掘算法SOA、SFP和分类算法SDT、SFPC。 最后,本文设计并实现B/S结构的挖掘平台,在这个平台上对以上几种封装后的算法进行测试,实验表明各算法都具有较高的准确性和时间效率。此外,本文还分别分析了频繁模式和分类挖掘在网络监控中的实际应用问题。
其他文献
今年建党节前夕,丽江地委委员、地委组织部部长段鸿来到永胜县永北镇,亲手将“全国先进基层党组织”的奖牌和证书交到了镇党委书记陈正 On the eve of the founding of thi
澳大利亚当代女作家考琳?麦卡洛的《荆棘鸟》以半个世纪的时间为经,以克利里一家三代人为纬,用她细腻的心思和流畅的文字,编织了一幅“神与人”、“爱与痛”、“乐与苦”的壮
随着科学技术推动生产力的进步以及居民收入和生活条件的不断改善,零售业正在发生持续的变革,大型连锁零售企业迅速崛起并不断发展壮大。大型连锁零售商的出现一方面改变了零售供应链的主导权结构,另一方面改变了零售终端市场的竞争格局。在这样一种新的市场结构下,制造商和零售商应当如何制定令自身利润最大化的价格;不同的市场结构又会对供应链各参与主体的决策和获得的利润有怎样的影响都是丞待解决的问题。本文构建了一个包
江泽民在党的十六大报告中强调党风建设时指出:“不坚决惩治腐败,党同人民群众的血肉联系就会受到严重损害,党的执政地位就有丧失的危险,党就有可能走向自我毁灭。”因此,清
年仅38岁的姚富英是辽源市新型电力建筑材料厂副厂长兼党支部书记,多年来,她为企业的发展倾注了全部心血,取得了出色的工作成绩,先后被评为全省乡镇企业优秀青年厂长(经理)
面对日趋激烈的商业竞争,各企业纷纷走上信息化道路,通过ERP提高企业的商业竞争力。进而,对这些海量的ERP数据进行数据挖掘,从中得到潜在的、有用的知识,以辅助商业决策。但是随着
易腐品广泛存在于人们的生产、生活之中,其易变质特性给企业的经营决策带来诸多困难。作为易腐品供应链的两个关键环节,生产和配送一直是供应企业决策的难题。本论文从配送环节入手,研究大批量生产情况下易腐品的配送问题,以及生产与配送衔接紧凑的强时效性易腐品的生产-配送集成调度问题。考虑到企业的生产和运输能力制约着客户订单的完成情况,进一步对能力水平进行细分,从收益角度研究能力受限时基于订单选择的两类优化问题
作者在“构造作用力影响成岩成矿静水压力”理论研究基础上,逐步形成成矿深度研究新的观念和测算方法;就是要先从成岩成矿测算压力中消除掉构造附加静水压力,然后再对上覆岩
与科技作品不同,文学作品中语言具有更为广泛的外延.除信息传递外,在这里语言多义的朦胧性被开掘,其美的特性得到最大化的发挥,语言被用来制造一种意境,勾勒描绘种种微妙难言
称谓语是人类在进行语言交际时必然涉及的一个范畴,它在一定程度上可以反映出交际双方的社会地位,亲疏关系.但是,称谓语的使用与交际双方所处的语言环境有很大的关系.华裔美