一种新的海量数据分类方法

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:sheygy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
使用支持向量机对非线性可分数据进行分类的基本思想是将样本集映射到一个高维线性空间使其线性可分。文章则基于Jordan曲线定理,提出了一种通用的基于分类超曲面的分类法,它是通过直接构造分类超曲面,根据样本点关于分类曲面的围绕数的奇偶性进行分类的一种新分类判断算法,不需作升维变换,不需要考虑使用何种核函数,而直接地解决非线性分类问题。对数据分类应用的结果说明:基于分类超曲面的分类法可以有效地解决非线性数据的分类问题,并能够提高分类效率和准确度。 The basic idea of ​​using SVM to classify non-linear separable data is to map the sample set into a high-dimensional linear space to make it linearly separable. Based on the Jordan curve theorem, this paper proposes a general classification method based on classification hypersurfaces, which is a new classification judgment by directly constructing the classification hypersurfaces and classifying them according to the parity of the surrounding numbers of the classification surfaces The algorithm does not need to do dimensionless transformation, so it does not need to consider which kind of kernel function to use, but directly solves the problem of nonlinear classification. The results of applying data classification show that the classification based on classification hypersurface can effectively solve the classification problem of nonlinear data and improve the classification efficiency and accuracy.
其他文献
本文构筑的适应型模糊神经网络模型实现了神经网络的学习训练能力、模糊逻辑系统的仿人推理功能以及匹配寻踪的适应性技术的结合。以其对具有不确定性特征的机器视觉目标图像进行辨识处理,取得良好效果。
结合低渗气藏的地质特征 ,并通过气层潜在性损害因素的分析对比 ,深入调查研究了低渗气藏在气层打开后产生损害的特点和损害机理 ,并对损害程度定量化进行了探讨 .研究结果表
研究了低渗透油藏低速非达西径向流的动边界问题,给出了高精度的积分解,分析了启动压力梯度对压力分布的影响,发现启动压力梯度越大,井底附近压力下降越快,外边界传播越慢.
讨论三维非线性对流-扩散方程第一边值问题的特征-差分方法,基于正六面体20点三二次插值给出了误差估计.
基于纬纱单元图像,运用相关分析方法,首先求得纬纱循环数、同类纬纱单元图像,然后对同类纬纱单元图像进行经向亮度分析,再经二值化处理和中值滤波,便可确定经纱的位置和经纱
提出了用一阶导数分光光度法测定铝材着色槽液中微量铝的方法,结果表明,在pH5.0~7.0之间,乳化剂OP存在下,Al与铬天青S(CAS)形成稳定络合物,测定633.0nm处的导数值,选择性大为
数控加工是自由曲面高质量和高效率的加工方法,生成无干涉过切刀具轨迹是自由曲面数控加工技术的关键。随着高速加工技术的发展,高速机床生成的刀具轨迹越来越受到重视。本文综
论述了调优系统的原理和功能 ,给出了系统的设计思路和实现方法 The principle and function of the tuning system are discussed, and the design ideas and methods of t
以丙烯酸酯及苯乙烯为单体,采用复合乳化剂合成了一种低固含量的苯丙乳液,作为涂布纸涂层胶粘剂,降低了生产成本.本文讨论了该胶粘剂的合成工艺、引发剂、乳化剂、活性添加剂
DP算法是求解SAT问题的最有效完全算法之一,论文分析和讨论了DP算法中的各种分枝文字策略.并基于对不满足解数估计的方法,提出了一个有效的分枝文字策略.实验结果表明,提出的