【摘 要】
:
k-近邻(KNN)算法是一种有效的多分类算法,它具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是它有两个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导
【机 构】
:
太原理工大学信息工程学院; 山西大学自动化系;
【基金项目】
:
国家自然科学基金资助项目(61402319、61403273);山西省自然科学基金项目(No.2014021022-4)
论文部分内容阅读
k-近邻(KNN)算法是一种有效的多分类算法,它具有简单、稳定的特点,在数据挖掘领域得到了广泛的应用。但是它有两个主要缺点,一是算法的准确度与k值有很大关系,不同的k值会导致准确率有很大的不同;二是它属于非增量式算法,随着数据量的增加,算法的分类速度会越来越慢,影响了它在海量数据分析中的应用。三支决策的主要思想是将整体分成三个独立的部分,引入了不承诺的决策选项,规避了错误接受或者错误拒绝的损失。本文把三支决策思想引入KNN算法,对边界域样本特殊处理,减小分类代价,提高了海量数据处理的正确性,同时对KNN算法进行改进,提出了一个基于KNN算法的增量式算法,提高了算法的快速性。
其他文献
自从中小学教育实行新课改以来,每个商家都在抓契机,寻找更好的发展机遇。因此也就出现了市面上林林总总的教辅图书。教辅类图书因具有出版周期较短、用量较大、市场风险小、回款有保证、成本低等特点,成为一些出版社获取利润的主要产品,成为出版社拉动经济增长的支柱性出版物。在这种情况下,一些教辅编辑为“抢饭碗、占市场”,在短期内“剪刀+浆糊”策划、编辑、出版大批的教辅图书,直接导致了教辅图书粗制滥造、质量低下现
张某,女,63岁,干部。2006—03—26初诊。素有支气管扩张史,自2003—07咯血不断,咳嗽少痰,或不咳嗽,仅咯血。2006—03—15因咯血加重入住江西中医学院附属医院,当时轻度咳嗽,咽喉干痒,胸
抗生素(antibiotic)是指由微生物(包括细菌、真菌及放线菌属)产生,能抑制或杀灭其他微生物的物质,是20世纪最重要的医学发现之一。然而抗生素引起的副作用不容忽视,早在20世纪50年代
6月29日,国家钒钛制品质量监督检验中心在攀枝花正式开建。这是我国首家钒钛制品质检机构,将为钒钛产业发展精品、延伸产业链提供强有力的技术支撑。
慢性盆腔炎病情顽固,部分为急性盆腔炎遗留的病理改变,并无病原体,抗生素治疗无明显效果,当机体抵抗力下降时,可急性发作。2003—11~2005—03,我们运用加味升带汤治疗慢性盆腔炎156
从单一的教育图书出版商向综合的教育服务提供商转型,已成为国际教育出版巨头和中国教育出版大社们一致的发展战略选择.转型是大势所趋培生教育出版集团是"世界领先的学习公
<正>本刊讯圣诞、新年、春节接踵而至,如何为孩子选购礼物也成为一个话题,亚马逊中国数据显示,人们喜欢通过书籍向孩子表达祝福以及期望。2014年12月少儿书在整体图书销量中
【正】本刊讯4月14日至18日,江苏凤凰美术出版社出版的《汤小团》系列图书的作者,儿童文学作家谷清平在四川成都开启了她的"作家进校园"人文之旅,分别在四川师范大学附属小学
深化供销合作社综合改革要实现"五个突破":在深化社有企业改革上取得实质性突破;在当好农村商品流通的主力军上取得实质性突破;在基层社重组改造上取得实质性突破;在引领农民专
重庆农资集团坚持“立足西南,走向全国”的市场方针,坚持“农资为主,实效多元”的发展战略,秉承“诚信经营、服务‘三农’”的企业宗旨,坚持以“农”字为圆心,围绕农资产业链