基于欠采样支持向量机不平衡的网页分类系统

来源 :计算机系统应用 | 被引量 : 0次 | 上传用户:DDD1968
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个信息爆炸的时代,如何处理这些海量的数据如何有效的分类已经引起了人们的高度重视,尤其是在互联无技术迅速发展的阶段,网页分类这领域已成为热点.与传统的分类方法相比,支持向量机具有高维、小样本、适应性强的特点,能够非常有效率的解决网页分类问题,但是不平衡数据的分类这一方面,存在着分类不精确的问题.所以本文提出了新的解决不平衡数据样本策略,便是将欠采样策略与传统的支持向量机结合起来,在减少多数类样本集中噪声数据的基础上增加少数类的样本集数量,从而使得不平衡样本集趋向于平衡,最后结合SMO(Senquenti
其他文献
这研究的目的是学习胸 intraductal proliferative 损害(IDPL ) 的临床、病理学的特征并且与侵略乳癌联系了的目的。我们包括平常的 ductal 增生,不正常的 ductal 增生的 57
这研究的目的是建立稳定地在肺 cancer-1 (TSLC1 ) 表示肿瘤 suppressor 的 osteosarcoma 细胞 sublines 的目的基因并且在人的 osteosarcoma 细胞线 MG63 的生长抑制上评估
Objective: The purpose of the study was to study the effect of Huaier, a traditional Chinese medicine, on the cell cycle adjustment in MOLT4 cells in vitro. Met
针对目前电力行业煤质分析的需求,提出了基于Hadamard近红外光谱的煤质分析技术,对Hadamard近红外光谱仪研制、控制分析软件设计、煤炭光谱信号采集、指标特征信息提取、定量
云计算环境下,传统的身份认证技术表现出一定的缺陷,为了遏制不可信用户的入侵行为,本文结合传统的身份认证和行为认证,论述了云计算环境下的用户行为认证机制.建立了用户行
黑客攻击和信息泄露对高校园区网造成了极大的网络和信息安全威胁,在网络安全响应机制和流程中,快速隔离和查封事故点可以极大的减小已发隐患对整个园区网络的负面影响.基于
单社交网络影响最大化问题已经得到了学术界的广泛关注与研究,然而如今多社交网络之间呈现信息互通的趋势.多社交网络中存在的桥梁用户(Bridge User,BU)(即同时拥有多个社交网络
国家电网公司正推进资产全寿命周期管理体系建设,电网GIS图形作为电网的信息化表征,为了实现电网异动信息的全过程管理,通过电网图形多时态多级管理机制,同时引入Mongo DB非
针对传统的AdaBoost算法中,存在的噪声样本造成的过拟合问题,提出了一种基于噪声检测的AdaBoost改进算法,本文称为NAdaBoost(nois-detection AdaBoost). NAdaBoost算法创新点在于
设计了一种跨网传输的串口通信软件,该软件采用数据收发双线程机制和数据队列线程间数据共享机制,设计了数据通信的数据帧类型校验、数据帧CRC校验和数据帧帧长校验等方法,保