基于BART算法的分类问题研究

被引量 : 0次 | 上传用户:hs20081987
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,特别互联网技术的飞速发展,使得信息的规模呈现爆炸式增长,那么如何从这些数据中挖掘重要信息成为各个领域的共同需求,而分类问题作为模式识别和机器学习领域的常见问题而一直备受关注。By Hugh A. Chipman等人于2008年提出贝叶斯累加回归树(BART)回归预测模型,并且2010将其推广应用到分类问题上去,是一种基于贝叶斯树的集成学习方法,具有泛化能力强及结果以概率形式输出的优点,鉴于该模型对二分类问题具有较好的性能,本文就该模型扩展到多分类问题上进行了研究,主要工作如下:首先对三种常用处理多分类问题的分解策略进行了介绍,并且说明了三种策略结合BART分类模型的可能。随后针对OAOBART算法中错分样本的实际类别得分排名基本处在第二名的情况,提出了改进的OAOBART算法(MOAOBART),该算法是对落入不可分区域的样本利用其隶属于得分最大和次大的类别的隶属度来提高分类精度。通过对UCI上十个数据集的测试表明,改进的算法比原有的算法的不可分区域的分类精度和总体分类精度有所提高。针对OAO分解策略中分类器个数会随着类别个数K以O (K2)的速度增长,提出了基于一次数据划分的OAOBART算法(ODMOAOBART),根据类到其余类的距离之和对整体数据类别划分成类别个数近似相等的两个簇,然后分别对这两个簇使用MOAOBART算法处理,这样可以在一定程度减少分类器的数量,从而也可以减少训练和测试的时间。对多个UCI数据集进行测试表明,该算法在识别精度相当的情况下,训练时间和测试时间都明显降低了。
其他文献
受不同环境、气候、地理、人文因素的影响,公共设施需要呈现出不同的形态与用途。在公共设施发展的历史中,景区的公共设施不仅需要体现出公共设施的普遍用途,还需要体现出它特有
<正>在英国,学校社会工作是个不常用的概念,地方教育当局和政府常把这一工作称为"教育社会工作"(ESW)或"教育福利服务"(EWS),从事这一工作的人员被称为"教育福利官员",他们不
德古在历史上是重要的世俗权威,是彝族习惯法最主要的传承者,彝区的绝大多数纠纷和矛盾都由德古依据彝族习惯法解决,德古是彝区最重要的稳定力量。现代社会,彝区纠纷解决的权威出
润滑是降低摩擦、减少磨损的主要手段。大概有80%以上的滚动轴承和20%的滑动轴承是脂润滑的。润滑脂的主要作用就是在轴承的摩擦界面间提供一层润滑膜,防止摩擦界面直接接触。
本文针对目前我院教改研究项目结题中存在的问题进行分析,并提出了提高我院教改科研课题结题率的对策。
随着世界经济全球化和我国改革开放的日益深入,尤其是十八大召开以来,我国进入全面建设小康社会的关键时期和深化改革开放、加快转变经济发展方式的攻坚时期。新疆作为我国今后
随着办学规模的不断扩大,高校对新增办学空间的需求逐步增强。新校区建成后,面对全新的学习生活环境,大学生易产生搬迁适应障碍。为确保学生搬迁工作顺利开展,维护新的校园稳
<正>有媒体报道,韩国6款知名泡面检出致癌物苯并芘。对此,台湾多家卖场表示已将相关商品下架。作为一种致癌物质,苯并芘在食品中被检测出来,实在令人胆颤心惊。苯并芘,食物中
两《唐书》对韩愈的评价歧异颇多 ,《新唐书》持褒扬态度 ,《旧唐书》则有贬词。本文从分析中唐元和、五代、北宋的文学背景入手 ,主要阐明两个问题 :首先 ,元和之际的文坛盟