基于虚构理论对不平衡数据集中少数类关联规则挖掘的研究

来源 :云南大学学报:自然科学版 | 被引量 : 0次 | 上传用户:xyc657924564
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在网络入侵检测系统中,数据挖掘往往面对的是不平衡数据集,而对不平衡数据集中少数类的挖掘是现在研究的热点.针对不平衡数据集中少数类的挖掘问题,提出了不平衡库关联规则挖掘算法(ARUD).算法首先构造一个知识联接强度矩阵,用来存储所有二项集的支持度计数,然后基于该矩阵挖掘满足最小说服度的所有关联规则,且ARUD算法仅需扫描整个事务数据库1次.采用了UCI数据库中4个典型的不平衡数据集,对比A研0ri算法与CFP-Growth算法,ARUD算法能有效提取不平衡数据集中的少数类,并在数据挖掘运行时间和占用内存方面
其他文献
12月18日,华旗爱国者Vcan电视服务的正式发布。作为一种视频资源创新型服务,Vcan具有每日更新、便捷贴心的特性,为整个行业解决视频资源下载更新问题带来全面革新和改变。
目的了解全国临床实验室常规生化专业的室内质量控制现状。方法采用网络问卷调查的方式对全国1 952家临床实验室生化专业的室内质量控制的现状进行调查,并对结果进行分析。结
目的:评价流式荧光法(FFA)在癌胚抗原(CEA)、细胞角蛋白19片段(CYFRA21-1)和神经元特异性烯醇化酶(NSE)检测中的应用价值。 方法:用FFA检测CEA、CYFRA21-1、NSE的精密度,确定FFA与电化学
高性能工程水泥基复合材料(Engineered Cementitious Composites,简写为ECC)相对于普通混凝土材料具有较高的极限拉伸应变能力.相对于目前广泛采用的粗放式配合比列表法、绝对
随着人口老龄化进程的加速,脑小血管病(CSVD)的发病率也在不断上升,其导致的多种症状严重影响了患者的生活质量。MRI弥散张量成像(DTI)作为新近发展的影像技术,有无创显示白
目的:探讨micorRNA-335(miR-335)表达及甲基化水平在多发性骨髓瘤(MM)诊断中的应用。 方法:用荧光定量PCR检测43例MM患者和30例体检健康者外周血单个核细胞(PBMC)中miR-335的表达水平
生物特征识别是一种有着特征唯一、不易复制等良好特性的个人身份鉴定与识别技术.但在识别过程中,个人信息通过公开信道传输或网络服务器存储时,有可能会受到第三方的截获和修改,或通信双方提供虚假信息进行相互欺骗.可通过引入全同态加密协议以保护数据与分类器.此类方案设计主要存在2方面问题:一方面是只支持"加乘"运算的全同态加密算法与识别算法的运算相容性问题;另一方面是由于加密算法的约束导致识别率与运行效率的
云南省福贡县地质环境脆弱,滑坡灾害频发,对其开展滑坡灾害易发性研究具有重大意义.首先,在研究了福贡县地质地理环境特征和滑坡现状发育特征的基础上,从地理环境因素、地质环境因素、人类活动因素3个维度选取9个指标因子建立滑坡灾害易发性评价指标体系,并利用滑坡频率比法充分考虑各因子不同状态下对滑坡灾害的不同影响情况进行各指标因子状态分级;其次,引入信息量模型并基于GIS平台对福贡县滑坡灾害进行易发性评价;