【摘 要】
:
K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时
【基金项目】
:
国家自然科学基金资助项目(71371063),河北省高等学校科学技术研究重点项目(ZD20131028),河北大学研究生创新项目(X2016059)
论文部分内容阅读
K-近邻(K-NN:K-nearest neighbors)是著名的数据挖掘算法,应用非常广泛.K-NN思想简单,易于实现,其计算时间复杂度和空间复杂度都是O(n),n为训练集中包含的样例数.当训练集比较大时,特别是面对大数据集时,K-NN算法的效率会变得非常低,甚至不可行.本文用实验的方法比较了2种加速K-NN的方法,2种加速方法分别是压缩近邻(CNN:condensed nearest neighbor)方法和基于MapReduce的K-NN.具体地,在Hadoop环境下,用MapReduce编程实现
其他文献
伴随着新时期课程改革的进行,研究型课程已经纳入了新型课程类型的行列,结合目前高师改革的现状,创建具有地方特色的研究型课程,可以更好的连接课程理论和实践,为新时期的课
为获得可用于氨基糖苷类抗生素多残留检测样品净化和富集过程中的固相萃取特异选择性填料,对以阿米卡星为模板,采用沉淀聚合方式制备分子印迹微球的方法进行了研究,并对合成
数字传媒业掌握着先进的技术和丰富的内容资源,具有开展公共文化服务的多种有利条件,能够以数字出版物、垂直门户服务、信息数据库等多种形式提供公共文化产品,在恰当的经营策略
5月8日,“2011数字出版与文化产业国际研讨会”在北京大学英杰交流中心召开。此次研讨会由北京大学新闻与传播学院现代出版研究所、中国新闻出版研究院联合主办。
“样板戏”作为20世纪60—70年代“文化大革命”时期的主流文学红极一时,但在样板戏中无论是《沙家浜》、《红灯记》、《智取威虎山》、《海港》、《奇袭白虎团》、《红色娘子
我们为什么要提出“转企改制后加强总编辑工作”这一问题,我想大概有三个原因:其一,从一般的情况来说,对出版社总编辑的地位、职能和作用,应该有一个逻辑的设定。我们现在讲文化软
不久前结束的党的十七届六中全会审议通过了《中共中央关于深化文化体制改革推动社会主义文化大发展大繁荣若干重大问题的决定》(以下简称《决定》),首次将“文化命题”作为中央