基于信息熵的集成学习过程多样性度量研究

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:szg6136755
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基分类器的多样性是提升集成学习的精度和泛化能力的重要因素,大数据环境下的传统后验证多样性度量方法计算效率较低,提出一种基于信息熵的过程多样性度量方法。通过使用分类器各属性的增益及其所在树层次得到属性集的联合增益,并计算分类器间的熵距离评估其多样性,利用熵距离按照K-means方法即可动态购置集成学习分类器。在西瓜数据集和典型分类数据集上进行比较研究,发现与传统集成学习方法相比,该方法具有相近的准确性和更高的计算效率。
其他文献
面对日趋激烈的市场竞争,各商业银行以代理业务为突破口,提高市场占有率显得尤为重要。文章通过对某银行代理业务进行分析,介绍代理业务的发展现状,并研究代理业务手续费的影
随着工业自动化的发展,步进电机的应用越来越广泛,步进电机是一种用于开环控制的驱动元件。阐述了步进电机的工作原理和特性,提出了基于单片机控制的步进电机驱动实现方法及
采用溶剂浸取法提取稻米油,通过单因素试验分别考察了溶剂种类、浸提温度、料液比和浸提时间等因素对稻米油的出油率及其谷维素含量的影响,并采用正交试验法优化提取工艺。结
<正> 戏曲中过去通用短水袖,一般水袖尺寸在一尺七或二尺左右,李德富在此基础上创造发展成为七尺长的长水袖,因而在今日的舞台上流行着短水袖、长水袖两种不同用途、不同风格
先祖周运恭(1882~1939),字幼门,湖北省天门市人.光绪二十三年(1897)入黉门为秀才,宣统元年(1909)应贡试,以全省第二名中选拔,次年赴京应保和骰试,以一等授七品小京官功名,留京
伴随中国快速城市化与机动化进程,私人汽车拥有量不断增长,由此引起的交通拥堵和环境问题已成为制约中国城市可持续发展的难题。基于上海市区的居民通勤问卷调查数据,采用多
泰国上北部地区位于泰国最北端,地理区位和政治地位特殊。活跃在该区域的环境类非政府组织较其他区域的非政府组织、社会团体相比,承担着特殊的政治和经济任务。经历多年的组
本文采用程序升温还原磷钨酸盐前体的方法,合成一种运用于CH4-CO2重整反应的新型催化剂—WP催化剂,以体积比为1:1的甲烷和二氧化碳的混合气为反应气,对催化剂的重整活性进行评
孝昌县青春丝绸厂,始建于1985年,在激烈的市场竞争中不断发展.到1993年产值已由建厂之初的100万元增加到270万元,其产品也由低档发展到中、高档,由单一的布料生产发展到服装