【摘 要】
:
针对KNN算法分类时间过长的缺点,分析了提高分类效率的方法。在KNN算法基础上,结合向量投影理论以及iDistance索引结构,提出了一种改进的KNN算法——PKNN。该算法通过比较待
【基金项目】
:
江苏省自然科学基金项目(BK20003017).
论文部分内容阅读
针对KNN算法分类时间过长的缺点,分析了提高分类效率的方法。在KNN算法基础上,结合向量投影理论以及iDistance索引结构,提出了一种改进的KNN算法——PKNN。该算法通过比较待分类样本和训练样本的一维投影距离,获得最有可能的临近样本点,减小了参与计算的训练样本数,因此可以减少每次分类的计算量。实验结果表明,PKNN算法可以明显提高KNN算法的效率,PKNN算法的原理决定其适合大容量高维文本分类。
其他文献
在设计遗传算法时,主要讨论算法种类的选取和控制参数的设置。基于规则归纳方法,提出一种研究遗传算法种类选择和控制参数设置的试验模型。以遗传算法数值优化问题为背景,用统一
提出了一种新的基于模糊集合的免疫危险理论模型,该模型在“危险”定义的基础上,引入模糊集合和隶属度的概念,对危险程度进行计算并分类,使机体感知危险的同时也能依据不同的危险
基于Windows API函数,实现了一个类模块,可增强VB中的滚动条控件,使滚动条控件的值范围扩大到长整数表示的范围,并可解决其白色背景问题。该程序封装了与滚动条相关的常见功
软件测试系统的研制是软件测试领域的一个研究热点。未初始化变量是C/C++程序中的常见故障,该类故障极汲导致计算结果错误或系统崩溃。针对C/C++语言中常见未初始化变量故障进行了分
自2013年至今,互联网金融产业在网络技术和移动通讯技术日益发展成熟的条件下,对我国整个金融行业产生了重大的影响,爆发出了巨大的能量。与此相伴,数千亿美元的移动支付产业
为继续费彻落实胡锦涛总书记关于采取援藏方式支持和帮助西藏导游队伍建设的批示精神.根据国家旅游局导游援藏工作的统一部署。2009年山西省旅游局选派了2名优秀导游员作为第
4月5日清明节,洪洞县大槐树旅游区内外彩旗飘飘,鼓乐振天,人山人海,洪洞县第十六届寻根祭祖节主祭圣典在新建祭祖堂隆重举行,这是16年来举办的规模最为宏大的一次集中祭祖活动,山东
旅游景区盘根错节的分属关系,造成了部门利益分割的狭隘,最根本的是因所有权分属不同所造成的经营管理权限的分散。旅游是经济产业,作为产业就必须走向市场,参与市场竞争。以市场
传统电信网和Internet都已经取得了巨大的成功,但各自也都面临着一些问题。在电信业务和IP技术不断融合,逐步走向“IP电信网”的过程中,有很多问题需要继续探讨和研究。本文在分析了传统电信技术和IP技术存在的一些明显差异后,指出“端到端的透明性”、“业务与承载的分离”、“终端智能性”等特点,在带来好处的同时也会带来新的问题。
图像边缘检测技术是图像处理中最重要的内容之一,针对噪声大、灰度对比度低的图像,利用小波尺度乘积模极大值对其进行边缘检测。在进行二进小波变换后,先把相邻尺度的小波系数直接相乘,抑制噪声和增强图像边缘信息,再运用模极大值检测图像边缘,利用隶属函数确定阈值。该算法可以免除传统小波模极大值边缘检测后繁杂的边缘链接,简单易实现,实验证明其对抑制噪声和增强弱边缘有良好的效果。