基于K均值和k近邻的半监督流量分类算法

来源 :信息工程大学学报 | 被引量 : 0次 | 上传用户:chunya88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对流量分类中样本标注瓶颈和类不均衡问题,提出一种基于K均值和k近邻的半监督流量分类算法.采用K均值聚类算法将混有少量标记样本和大量未标记样本的数据聚成若干个簇,然后采用k近邻算法利用簇中标记样本对未标记样本进行分类.在分类过程中根据簇中标记样本分布调整参与分类的最近邻居数,从而克服了类不均衡对识别小类流的不利影响.理论分析和实验结果都表明,算法在面对非均衡协议流时提高了小类流的识别率.
其他文献
赫鲁晓夫在俄罗斯历史甚至在世界历史上都是一位比较值得玩味的政治家。赫鲁晓夫在斯大林生前.吹捧斯大林是自己的“生身父亲”.一直受到斯大林的信任.培养为接班人.可在斯大林去
目的观察小青龙汤治疗支气管哮喘的效果。方法选取2017年2月-2018年1月医院收治的支气管哮喘患儿74例,随机分为观察组和对照组各37例。对照组给予常规治疗,观察组在对照组的
目前,我国已形成了以《刑法》第一百九十一条所规定内容为特定洗钱罪和以第三百一十二条所规定内容为普通洗钱罪以及包括第三百四十九条与毒品犯罪相关的洗钱活动在内的规定,
顶岗实习作为职业教育课程的重要组成部分,其质量提升一直是职校普遍关注的重要问题之一。作为情景学习理论的流派之一,人类学情境理论无论是在研究领域还是研究结论方面,均与顶
提存作为一项法律制度在合同法和担保法等法律中均有专门规定,而公证机构是目前法律有明确规定的提存机构,公证提存的职能作用也不断在有关文献资料中体现,但此项业务的开展
贪污罪主体对于贪污罪的认定具有关键作用,理论及实务界对于贪污罪主体存在较大争议,通过研究国际反贪污刑法规范,以明晰完善我国贪污罪主体刑事立法的途径。
我国早已进入老龄化社会,老年人口数量大,老龄化发展速度快,"未富先老"现象明显。我国当前最基本的养老模式大致有家庭养老、机构养老和社区居家养老三种。应提供家庭养老保
弱势群体的存在是不容回避的现实问题,弱势群体的救助也是不容忽视的主要矛盾。针对大量弃婴、孤儿存在的事实,必须建立健全完善的法律体系,运用法律手段,来确认和保护弱势群
“得黄山之影”的梅清生活于明末清初的特殊历史时期,人生经历及艺术成就比较丰富,本论文从梅清的生平家世及时代背景入手,归纳重要的时间与事件整理出他是在怎样的人生境遇下创作出诸多优秀独特的绘画作品。通过分析他众多黄山图册之中的一套——《黄山十景》,研究他的师承关系了解梅清的审美情趣,研究他的画面结构了解梅清的艺术方法,研究他的题跋大致了解他的诗歌与书法艺术,从而更透彻地理解他这一生,使我们对艺术创作与