基于NSJEP-list的强跳跃显露模式的挖掘方法及应用

来源 :湖南大学 | 被引量 : 0次 | 上传用户:lxy850628
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
强跳跃显露模式(Strong Jumping Emerging Pattern,SJEP)是近年来提出的一种具有良好区分能力的区分模式,基于SJEP的分类算法能取得较高的分类准确度,因此SJEP逐渐成为分类算法中一个重要的研究方向。由于目前SJEP的挖掘算法大部分都是基于树结构的,因此造成挖掘算法在时间和空间上消耗较大的问题;同时,在不平衡数据集的领域,SJEP无法表现出在普通数据集中展现出的良好的区分能力,特别是在正类的分类中。因此,本文针对SJEP的挖掘及分类算法进行了相关研究,主要工作如下:针对基于树结构的SJEP挖掘算法存在的时间和空间消耗较大的问题,设计了一种新的数据结构——NSJEP-list,并基于该结构,提出一种新的SJEP挖掘算法一—PPSJEP。该算法首先遍历数据集构建一颗PPSJEP-树,然后构造满足条件的1-项集的NSJEP-lists以代替PPSJEP-树,最后,通过对1-项集的NSJEP-lists的交叉迭代得到更长项集的NSJEP-lists,从而挖掘出所有的强跳跃显露模式。实验表明,基于NSJEP-list的挖掘算法可以有效地过滤掉冗余的JEP,并且,挖掘效率较传统的基于树结构的SJEP挖掘算法更高。在不平衡数据集中,由于从正类样本中挖掘出的模式不仅数量少,而且所对应的支持度也较负类偏小,这使得在分类过程中对正类的分类十分不利。针对这一问题,提出一种扩展的SJEP模式(extend-SJEP),该模式在正类中可以挖掘到一些额外的具有良好区分能力的模式;基于上述模式,提出一种改进的基于SJEP的分类算法,该算法通过对大类和小类分别赋予不同的权值,来降低传统的基于SJEP的分类算法中分类结果过度倾向于大类的问题。实验表明,这种扩展的SJEP模式和改进后的分类算法在类不平衡的情况下都表现出更优的区分能力,特别是在对少数类的分类中。
其他文献
继《刑法修正案(八)》将管制、缓刑禁止令纳入刑法后,《刑法修正案(九)》紧接着规定了职业禁止令,职业禁止令以特殊预防理论和刑罚个别化理论为理论依据,以宽严相济刑事政策
技术的进步,也带动着网络安全问题的加深。WEB防火墙作为一个安全工具,对网络通信有着重要的影响。WEB防火墙是一个对HTTP数据进行深入分析的防护系统。WEB防火墙系统作为网
动力电池是纯电动汽车唯一的能量来源,与汽车的动力性有关,其抗冲击结构关系着乘客的安全。电池箱作为动力电池的承载体,有保障电池安全的作用,其抗冲击结构也有保障乘客安全的作用。而电池箱属于质量较大的汽车零部件,能源消耗也比较大,因此对电池箱进行轻量化和抗冲击结构的研究显得尤为重要。因为纤维复合材料的质量轻、比模量大,而且比刚度和比强度都优于金属材料,使用复合材料取代金属材料对电池箱进行结构设计具有重要
随着社会和科技的进步与发展,互联网早已深入到人们日常生活的方方面面,成为人们生活中密不可分的一部分。但是目前互联网面临着诸如扩展性、地址空间、端到端高性能传输、实
数字图像处理技术的快速发展和计算机软硬件性能的提升,促使机器视觉技术在各个行业内得到广泛应用。国内外很多研究者把机器视觉应用于工业浮选,通过计算机实时监测浮选工艺
作为推动我国经济发展的三大增长极,京津冀、长三角和珠三角地区在生产能力和区域支撑方面的优势已十分显著。但在经济领先发展的同时,资源节约与环境友好压力对三大增长极经
本文研究课题来源于湖南大学智能仪器研究所和新疆电网公司合作研发的智能用电互动服务系统。基于该系统,本文设计了用电统计分析平台主站,并基于用电统计分析平台-主站设计
目的:国外有大量关于镰状细胞病对于肾脏的损害的研究,但是在尼泊尔鲜见相关研究。本研究通过分析尼泊尔国儿童镰状细胞病的相关表现,从而争取对尼泊尔国患儿的SCD所致肾损害
在有关跨国并购的研究中,公司治理理论的学者普遍认为并购是市场对目标企业原有管理团队经营效率低下的惩罚,替换原有管理团队,尤其是作为核心的CEO能够提升企业经营绩效。然
形成性评价在概念上涵盖许多能够提升学生学习结果的评价方法。AfL(促进学习的评价)和DBDM(基于数据的决策)作为其中两种,在当前受到了许多研究的关注。当前鲜有研究致力于提出能够提升教师形成性课堂评价能力的现实途径并开展相关的研究,而对于供职于新兴崛起的私立国际学校教师的相关研究更是寥寥无几。为此,本研究基于需求分析理论,采用《教师形成性评价能力水平》问卷调查了 33名私立国际高中英语教师的形成性