【摘 要】
:
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集
【机 构】
:
中国石油大学石油数据挖掘北京市重点实验室,中国石油大学计算机系
【基金项目】
:
十二五国家重大专项(2011ZX05020009);北京市重点实验室阶梯计划项目(Z121109009212008)
论文部分内容阅读
近年来,随着大数据分析需求的急剧增长,分类算法的运用也越来越广泛,如何为用户选择适用的分类算法成为数据挖掘技术在应用上亟待解决的难题。相关研究表明,同一算法在相似数据集上具有相近的分类效果。根据这一理论,构建基于数据集相似性的分类算法选择模型。首先采用数据集离散化方法来对数据集进行特征提取,构建样本库,然后结合邻近相似的原则为数据集推荐合适的分类算法。通过UCI数据集上的算法实验,结果表明大多数情况下推荐得到的分类算法具有良好的性能。
其他文献
GPRS是在GSM体制上发展起来的新型无线分组数据接入业务,具有实时在线、按量计费、快捷登录、高速传输、自如切换、资源共享、丰富带宽等优点。本文针对GPS车辆监控系统中现
本课题运用艺术辩证法观点,以图像思维的记忆模式为研究基础,以平面设计与装置艺术兼容汇通的时代性、必要性和可能性为主要内容,从后现代艺术的多元性、开放性和模糊性特点
现场报道是电视传媒中最常见同时也是最能体现电视多种元素和传播优势的一种报道样式和手段。如果将中国与西方电视新闻从业人员对现场报道的认识与实践进行一定程度的比较和
目的:初步观察珍珠茯苓汤治疗慢性乙型肝炎肝纤维化的临床疗效。方法:选取符合纳入标准的慢性乙型肝炎肝纤维化患者50例,采用简单随机对照原则,根据随机数字表随机分为2组,对照
胶印网点面积的检测是整个胶印过程中的重要环节。随着胶印向高速化、自动化方向发展,我国传统的网点面积检测方法已经不能满足现代化印刷生产的需求,因此研制高精度的网点面
城市化是人类社会发展和进步的必然趋势,城市发展已经成为全球发展的主题,发达国家已经进入城市化稳定阶段,我国的城市化进程也日益加快。改革开放以来,我国进入城市化快速发
近年来,公司治理已经成为一个重要的世界性课题。随着中国社会主义市场经济体制改革的逐步深入,中国企业改革正在进入公司治理改革的新阶段。公司治理是协调公司股东、董事会
本文在研究模糊理论和人工神经网络理论的基础上,设计了基于湿度的PZ1650胶印机润湿液检测与控制系统,并完成了对系统的建模与仿真。首先,利用湿度传感器,51单片机搭建数据采
我国高校后勤企业文化建设研究主要集中在“高校后勤企业文化的内涵”、“高校后勤企业文化建设的途径”以及“高校后勤业文化建设的作用”等几个方面,而高校后勤网站与高校
在临近黄海大面积盐田数字化地形测量中,运用GPSRTK技术,体现出定位精度高、数据采集快、受外界影响小的特点。介绍了GPSRTK技术的基本原理、实际应用和精度检核,并得出几点