【摘 要】
:
由于多类不平衡数据中某些类别的样例数特别少,使得基于支持度一置信度的关联分类方法在这些类上产生的规则较少,甚至没有,从而导致这些类别的样例很难准确分类.针对此问题,文中提
【基金项目】
:
国家自然科学基金项目(No.61170129);福建省自然科学基金项目(No.2013J01259);福建省中青年教师教育科研项目(No.JA15303)资助
论文部分内容阅读
由于多类不平衡数据中某些类别的样例数特别少,使得基于支持度一置信度的关联分类方法在这些类上产生的规则较少,甚至没有,从而导致这些类别的样例很难准确分类.针对此问题,文中提出改进的多类不平衡数据关联分类算法.为了提取更多小类的规则,根据项集与类别的正相关度提取规则.为了提高小类规则的优先级,提出利用项集类分布规则强度排序规则.此外,为解决规则冲突或无规则匹配问题,结合KNN分类新样例.实验表明,与基于支持度一置信度的关联分类方法相比,文中算法能提取更多的小类规则,且提高小类规则的优先级,在多类不平衡数据上取
其他文献
随着我国高等教育由精英教育向大众化教育发展,本科教育存在的弊端变得日益突出.英国古典大学本科教育的成功得到世界公认,向英国古典大学传统学习,要加强本科教育的根基地位
沥青混合料是我国公路建设中应用最为广泛的施工材料。南方地区的高温潮湿环境致使沥青的疲劳性能发生变化。为了获得沥青混料的疲劳损坏情况,有必要讨论温度和湿度对其疲劳
为了高效地完成实名制铁路车票的验票流程,提出1种基于旅客面部Gabor特征的身份认证算法。采用二维Gabor滤波器提取人脸图像的Gabor特征,并对这些特征进行变换和重组;对重组
<正>新课程标准指出:学生是学习的主人,语文教学应激发学生的学习兴趣,注重培养学生自主学习的意识和习惯,为学生创设良好的自主学习情境,尊重学生的个体差异,鼓励学生选择适
目前天津港港区内大部分道路为水泥混凝土路面,在使用过程中车辆超载十分严重,此外由于路基处理及混凝土本身原因或施工缺陷,常导致混凝土路面发生局部破损,大大缩短了道路的使用
通过对方向导数和偏导数定义的讨论,研究两者之间区别与联系,揭示这两个概念的不同,对两者的关系做进一步的讨论,得出一些结论,并对方向导数的计算方法给出总结。
当前强化政府的公共服务职能,逐步完善符合国情、比较完整、覆盖城乡的可持续的基本公共服务体系,提高政府的保障能力,推进基本公共服务均等化,提升政府公共服务能力,是政府
目的:分析桥小脑角肿瘤术后并发症与护理干预措施。方法:以本科科室2014年1月至2017年2月收治的82例桥小脑角肿瘤术后并发症患者为研究对象,对其病情进行评估并制定相应的护
在经济全球化的趋势下,各国之间的经济交往日益频繁,经济联系更加紧密,这给我国的中小企业带来机遇的同时也使其遭受巨大的竞争压力。本文通过分析中小企业进行国际贸易融资