新的基于优化间隔分布的AdaBoost算法

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tiantianaiguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘中主要内容为分类,聚类,预测等。本文主要研究数据挖掘中的分类算法,以PAC为理论学习依据,提出的集成算法。这种算法是通过寻找一些比随机猜测稍好的一些分类器,将他们通过加权投票原则组合成强分类器,这就避免了直接寻找一个分类准确率较高的分类器。文章介绍了集成算法中经典算法,主要是AdaBoost算法和一种改进后的AdaBoost算法,分析了泛化误差与分类器的间隔之间的联系。同时Breiman提出了算法的泛化性能取决于最大化最小间隔,并给出Arc-Gv算法; Schapire提出算法的泛化性能取决于间隔分布的定理,随后研究者发现一个好的优化间隔分布对于泛化性能尤为重要,提出了优化间隔分布的AdaBoost-QP算法。研究者提出了AdaBoost-QP算法的思想——在间隔满足高斯分布的前提下,建立一个优化间隔分布的模型。本文主要是依据此思想对一种改进后的AdaBoost算法进行优化间隔分布。利用改进后的AdaBoost算法每次迭代产生的分类器,建立一个目标函数为分类器的平均间隔与间隔方差的二次规划,求解出弱分类器相应的权重系数,利用投票加权得到最后的组合分类器使间隔分布得到优化。依据影响一个算法泛化性能的关键因素为间隔分布,并通过实验表明最后改进的算法的泛化性能有所提高。
其他文献
沿东太平洋浅海分布的双壳类软体动物数据显示,大量非浮游异养型双壳类具有广泛的地理分布.其中某些种的纬度跨度可达30°以上,这些种绝大部分是分布在38°N~5°S之间.东太平
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
学位
随着各种3D技术出现,要得到一个物体的三维模型已经不是很难的技术问题。然而扫描一个三维模型需要花费很多时间,在三维动画和电影中,为每一帧画面扫描一个模型也是不现实的,所以
本文主要介绍了复几何中L2方法的历史及其三个重要的定理:H(o)rmander定理,L2延拓定理和Skoda分离定理.  
基本解方法和Trefftz方法都是解决齐次偏微分方程边界值冋题的两种有效的无网格方法。在Trefftz方法中,近似解由一系列的T完备基函数逼近,而在基本解方法中,近似解由齐次线性微
本文主要研究了带有不同种发生率的反应扩散传染病模型和一个捕食者食饵模型,分析了时滞对模型的影响以及反应扩散方程解的定性性质等。  首先介绍与本文的研究工作相关的背
本文主要阐述了永宏PLC在电子制造行业多刀自动切割机上的应用。通过采用永宏PLC高速脉冲输出指令,很好地实现了精确定位切断功能,并且采用FBs系列通讯口2实现高速联机功能,