基于Trie Merging的数据流频繁树模式挖掘研究

来源 :武汉大学 | 被引量 : 0次 | 上传用户:wuyuwei1210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统研究中,数据挖掘往往处理的是结构规整的数据。相反,存在于互联网中的树形结构数据,与传统的关系数据相比,能够表达更复杂的数据类型。互联网中树形数据规模愈加庞大,其将会成为人类知识的主要表现形式之一。因此,挖掘树形结构数据正在成为数据挖掘领域中重要的研究方向。在过去十年中,在大型静态数据库中挖掘频繁模式已被广泛研究。如今,数据流往往是顺序到达的而且难以从一开始就获取整个数据集,加之数据集的大小随着时间的推移在迅速增加。因此,传统的应用在静态数据库上的挖掘算法便不再适用。因其动态改变、高速到达、无限增长的特性,以及内存的有限性,快速识别数据流中最近时间内的数据的信息能为数据流的分析提供有更价值的信息。本文的研究基于上述两个研究热点进行的,讨论基于滑动窗口模型的数据流中频繁树模式挖掘问题,旨在挖掘数据流中最近时间段内的频繁子树模式。过去的研究中对数据流频繁项集挖掘已有广泛研究,但对于数据流频繁子树模式挖掘研究相对较少。StreamT是经典数据流频繁子树模式挖掘算法,且适用于滑动窗口模型。其在删除不在滑动窗口内模式效率不高,且提出的扫描分支栈结构繁琐。STMer算法是最近提出的挖掘数据流频繁模式算法,其比StreamT效率高,但更新模式计数的时候需要多次扫描子树模式。因此,本文针对以上问题,提出一种基于Trie Merging的改进的数据流频繁模式挖掘算法—SWMiner,SWMiner算法使用基于前缀树的结构来压缩存储生成的树模式并且基于Trie Merging机制能有效地更新子树模式的支持度。实验结果表明,SWMiner算法在滑动窗口模型中的性能优于目前现有的常用算法,能有效地挖掘最近时间段内的频繁树模式。
其他文献
索穹顶结构是一种由脊索、斜索、环索和撑杆构成的空间张力索杆体系,这种结构以其新颖的结构造型、巧妙的构思、较轻的自重和快速的施工,一经问世便引起了国际空间结构学术界
随着能源消耗的日益加剧,如何合理高效的利用能源已成为倍受人们关注的焦点。相变储能是近年来兴起的一种提高能源利用效率的先进技术,可用于解决能源供需之间的失配矛盾。相
氯酚类污染物具有生物难降解性、生物累积性和高毒性,是备受广泛关注的一类优先控制污染物。针对该类污染物的处理,国内外相关研究学者已开展大量研究工作,并开发出多种治理
溴化锂吸收式制冷系统以对环境无害的溴化锂水溶液为工质,并且能够充分利用工业生产中的大量余热、废热及太阳能等,在保护环境和节约能源方面具有一定的优势,因此引起了人们
在骨骼肌中,存在着由一个T小管膜和两个内质网/肌浆网扁平囊泡膜组成的膜结构,被称为三联体。与骨骼肌兴奋-收缩偶联相关的钙释放复合物就位于三联体结构中。当神经信号激活肌肉细胞后,动作电位会沿着T小管穿过整个肌纤维膜,激活位于T小管膜上的电压门控钙离子通道二氢吡啶受体,并诱导其产生形变,二氢吡啶受体的形变会进一步激活位于肌浆网膜上的钙离子通道鱼尼丁受体。鱼尼丁受体则将储存在肌浆网内的钙离子中释放到细胞
中国作为目前世界上二氧化碳排放量最大的国家,同时也是世界第二大经济体,虽然不受到国际上对温室气体节能减排的强制限制,但自《京都协议》生效后,我国主动作出了减排的承诺并自2012年开始建立起全国范围的碳交易市场。碳排放权因此作为一种稀缺资源,其经济价值随着碳交易市场的建立和发展被我国各行业所广泛关注。电力在我国各个碳交易市场中均是首批被纳入排控范围的重点行业,随着碳交易市场的不断扩大和繁荣,电力企业
铺管船是一种工程类作业船舶,其设备种类多,工况环境恶劣,协同作业控制复杂等诸多原因,原有铺管船电站难以达到供电连续性和可靠性的要求,与当前主流船舶电站自动化水平差距
随着经济技术的飞速发展,城市乡镇的快速生活节奏,让人们更加注重绿色、环保、健康的生活环境,而垃圾清扫车则是提高环卫工人工作效率,创造干净整洁生活环境的主要设备。依据以人为本的原则,设计出更人性化,符合需求的垃圾清扫车是目前需要解决的重要问题,为此,本文运用感性工学理论,对垃圾清扫车进行了研究设计。为使城市道路清扫车设计贴近我国市区道路现状,提高工作效率。首先着重研究了我国城市的垃圾转运状况以及市区
目的利用光学相干断层扫描血管成像技术(optical coherence tomography angiography,OCTA),观察原发性急性闭角型青光眼慢性期患者视盘血管密度与正常人的差异;分析各青光眼参数的相关性及诊断价值;评估急性闭角型青光眼慢性期患者行青光眼白内障联合手术前后视盘周围血管密度的变化。方法青光眼组包括30例(30眼)确诊为急性闭角型青光眼慢性期并接受青光眼白内障联合手术的
气体渗氮作为一种常用的金属材料表面强化方法之一,可显著提高表面耐磨耐蚀性能。随着智能制造和精密制造的快速发展,对零件的耐磨性和耐蚀性要求越来越高,传统气体渗氮急需进行技术革新。通过气体催化渗氮和氮化后氧化处理,能进一步提高表面性能,延长零件的服役寿命和精密保持性。因此,本课题在实际生产中具有重要的理论研究意义和工程应用价值。本文通过对AISI304不锈钢和12Cr1MoV钢的气体催化渗氮实验,研究