用于大数据分类的KNN算法研究

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:lixin062
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对KNN算法在处理大数据时的两个不足对其进行了研究,提出多层差分KNN算法。算法对已知样本根据类域进行分层,既避免了传统改进算法中剪辑样本带来的判别误差,又大大降低了无效的计算量;同时在最后一层采用差分的方法进行决策,而不是直接根据最近邻进行分类,大大提高了分类的准确性。实验结果表明,该算法在对样本容量大、涉及邻域多的大数据样本进行分类时能取得较好的分类效果。
其他文献
目的:观察大鼠脑缺血再灌注后基质金属蛋白酶9(MMP-9)、基质金属蛋白酶2(MMP-2)的动态变化规律及其与脑水肿的关系。方法:将80只SD大鼠分为假手术组(n=10)和实验组(再灌注6 h
<正> 新圣母公墓是莫斯科最著名的公墓。每次访问莫斯科,只要有机会,我都会到那里走一趟。在那里,我拜谒过伊·列维坦的墓。巡回派风景画家列维坦是晚生的一辈,只活了40岁,他
本文重点研究了地理信息数据安全监控技术。在分析现有文件监控技术和网络监控技术的基础上,根据地理信息数据文件的特点和要求,利用Win32API函数对于监控文件和WinPcap函数
采用超声喷丸(USSP)对工业纯锆进行处理,就其拉拉疲劳性能展开研究,并利用光学显微镜(OM)和显微硬度计分别对试样的微观组织和由表层到基体的硬度分布进行表征;利用X射线衍射
生物质液化技术可将低品位的固体生物质完全转化成高品位的液体燃料或化学品,是生物质能高效利用的主要方式之一。按照机理,液化技术可以分为热化学法、生化法、酯化法和化学
数字电视,已经成为全球不可逆转的潮流,目前有线电视数字化在我国各地大中城市正如火如荼的开展,作为数字电视终端设备的数字机顶盒也得到蓬勃发展,但是CA的不统一和地域性差
正如今,已经无需论证摄影是一门艺术,需要的是说明摄影是怎样一门艺术;如今,已经无需证明摄影艺术与绘画艺术有哪些共性,需要的是说明摄影艺术如何区别于绘画艺术而成为一门
随着我国建筑事业的快速发展,建筑消防工程的施工也有了新要求。尤其是在工程质量和工程技术要点问题的解决上都有了不同的对策。本文主要针对在进行建筑消防工程施工中,对其
审计师选择是审计研究的核心问题。本文首次研究了国有股权在中国A股IPO市场对审计师选择的影响及其具体机制。我们发现,国有股比例越高,公司选择高质量的审计师的概率越低;