正则化夹角间隔核向量机

来源 :河北大学 | 被引量 : 0次 | 上传用户:peiyingbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尽管模式分类问题已经得到广泛应用,但是怎样快速有效地对大样本数据集进行分类,尤其是怎样快速有效地对失衡大样本数据集进行分类仍需进一步加以研究。一般的分类方法是通过求解二次规划问题将数据集进行分类,但当数据集很大时,计算复杂度相当高,影响了分类精度和训练时间。针对样例分布失衡和样本容量较大这两个问题,该毕业论文从以下两个方面进行研究:1、对于大样本数据集的分类问题,提出了位置正则化核心集向量机。此算法在求解最小包围球得到核心集时,根据样例在特征空间中位置的不同,进行位置正则化,从而将最小包围球进行优化,以提高分类精度。2、针对失衡数据的分类问题,提出了一种新的分类算法,即中心向量夹角间隔分类算法,此算法是在特征空间中找到最优向量,通过最优向量进行决策。核化的中心夹角间隔分类算法等价于中心限制最小包围球问题,与位置正则化核心集向量机结合得到正则化夹角间隔核向量机,可对大样本数据集进行快速有效的训练。将以上方法在UCI数据集上进行了验证,实验证明了位置正则化核心集向量机比核心集向量机具有更好的分类性能,中心夹角间隔分类算法较之于传统的支持向量机分类精度相当甚至更高,并且正则化夹角间隔核向量机可以对大规模失衡数据集进行快速有效的训练。
其他文献
  本文利用域上的Galois理论和域的扩张理论,证明了有关根式扩张和分裂域的一些结果.第1章简单地介绍了一下本文的写作背景和主要工作.第2章先定义了几个基本概念:根式扩张、
单位:数量一万吨. 金额一亿美元 2004年1一3月累计 2003年1一3月累计 同比增长% 数量 金额 数量 金额 数量 金额 一、进口 1.纸浆 1 98 9 .2 04 162 6 .4 99 2 2.6 4 1.6 2.
在流体力学,信息技术,电气学等学科中,人们常用复数表示物理量,比如电流、周期以及二维势流等。但由于实验条件测量方法等原因,不能精确的确定这些物理量。但在实际研究中仍需使用
Bezout定理是传统代数几何的开卷定理.其弱形式是:两条交点有限的代数曲线交点上界不超过其次数的乘积,我们将两条代数曲线次数的乘积称为其Bezout数.鉴于Bezout定理在传统代
混合时间序列模型是近些年发展起来的一类重要的非线性时间序列模型,该类模型引起了众多学者的关注.在前人已有研究成果的基础上,本文研究了混合自回归滑动平均模型(Mixture
本文研究标的资产价格过程服从跳扩散模型时美式期权价格及其最佳实施边界当到期日趋于无穷大时的渐近分析。与传统的扩散模型相比,跳扩散模型可以更好地解释在实际金融市场
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
均质土壤中的地下水流动可归结为非饱和土壤水的流动,是土壤水未完全充满空隙时的流动,是多孔介质流体运动的一种重要形式。非饱和流动的预报在大气科学,土壤学,农业工程,环
一、改革内容  供给侧结构性改革,就是用增量改革促存量调整,在增加投资过程中优化投资结构、产业结构开源疏流,在经济可持续高速增长的基础上实现经济可持续发展与人民生活水
本文对几类子阵扩充问题和一类约束矩阵方程问题进行了研究。文章的主要工作如下:讨论了子矩阵的扩充问题.主要研究了一类子阵 在 约束下扩充为实矩阵的问题, 一类双子阵 在