K-近邻相关论文
现实世界中收集的数据集通常是含有缺失的,为了在不完备数据集上构建有效的机器学习模型,需要对数据集进行清洗。为了确保较好的清洗......
信息技术的快速发展使各行各业产生了大量有用或无用的数据,因此数据的挖掘与分类变得日益重要起来。面对爆炸性增长的数据,人们需......
空间数据挖掘旨在从空间数据库中发现和提取有价值的潜在知识.空间co-location(共存)模式挖掘一直以来都是空间数据挖掘领域的重要......
在多标签分类问题中,一个实例可能同时属于多个类别(或标签)。实际的电能质量扰动往往是复合扰动,多种扰动可能同时存在,所以电能质量......
We integrate k-Nearest Neighbors(kNN) into Support Vector Machine(SVM) and create a new method called SVM-kNN.SVM-kNN st......
抗微生物肽是由宿主产生的一类能够抵御外界病原体感染的小分子多肽,由于其特殊的防御机制和不易产生抗药性,已经成为医学与生物学......
人脸识别是模式识别、图像处理等学科的一大研究热点,是利用计算机分析人脸图像,从而提取出有效的识别信息,用来辨认身份的一门技术。......
认知科学的研究表明,感知信息对自然语言习得有重要的辅助作用。由于机器不能独立地把词汇和感知世界进行关联,因此出现了Grounded......
学位
个性化信息服务旨在解决按照用户的需求传递信息的问题。随着信息科学与技术的发展,信息已经渗透到人们生活的各个方面。移动电话的......
1975年,Shamos和Hoey利用计算机有效地计算了平面点集的Voronoi图,并发表了一篇著名的论文,计算几何从此诞生,成为计算机科学理论......
如何在浩若烟海而又纷繁芜杂的文本信息中获取最有效的信息是信息处理的一大任务。文本自动分类是实现这个任务的重要方法之一。在......
三维点云数据在影视游戏、逆向工程及文物保护与展示等各个行业的应用越来越广泛。囿于外界不可控变量、设备物理误差等因素,由测......
针对向量空间模型表示法的局限性,采用潜在语义索引在语义层面进行处理,是近几年提出的一种文本表示方法。潜在语义索引是利用统计......
文本分类技术可以用来帮助人们从海量的信息中获取有用信息,它已经得到了广泛地研究和应用。文本分类就是将一些未知的文本与预先......
现实世界中存在着大量无类标的数据,如医疗图像数据、网页数据、视频数据等。在大数据时代,这种情况更加突出。标注这些无类标的数......
脑⁃机接口是一种变革传统人机交互的技术,其中情绪脑⁃机接口是一类重要的脑⁃机交互,可望为情绪的调节、监测或评估提供定量方法......
基因芯片技术同时可以检测成千上万个基因的动态表达水平,这些表达值构成了基因表达谱数据。肿瘤的基因表达谱具有高维小样本的特......
可解释性是数据挖掘领域的研究热点,当数据处理结果具有可解释性时才能为决策者提供一种透明的指导作用。公理模糊集(Axiomatic Fu......
频谱感知是认知无线电的前提,具有重要的理论研究价值。在实际的感知过程中,认知用户按照一定规则分布在二维空间中,各个认知用户......
K-近邻技术被广泛用于分类、推荐等热点问题,但针对多元时序数据状态预测问题的解决方案相对较少.文章在三支决策思想的指导下,提......
为了解决大量日志数据导致的有效标记和人工筛选等问题,文中提出了一种K-means和K近邻(KNN)的日志异常检测方法。利用GloVe方法对......
[目的]基于局部密度的LOF算法时间复杂度高,且容易将处于簇边缘的正常对象误判成异常对象,INFLO算法引进反向k-近邻解决LOF算法这......
目的 为克服固定时间窗口分段导致R波截断的缺点,提出一种新的分段方法——固定R波个数的自适应窗口分段法,用于可除颤节律检测.方......
DNA 微阵列和高密度的寡核苷酸芯片是广泛应用于疾病研究的新生物技术,基因表达微阵列数据主要应用于生物样本的分类以及临床研究,在......
本文提出了一种学习权值算法以改进K-NN(K-NearestNeighbor)分类算法的分类准确率。从数学意义上讲,这种权值学习相当于欧氏空间中......
压缩近邻(CNN:Condensed Nearest Neighbors)是Hart针对K-近邻(K-NN:K-Nearest Neighbors)提出的样例选择算法,目的是为了降低K-NN......
局部离群因子(LOF)是对过程数据的局部离群程度的定义,然而工业过程对数据异常检测的实时性要求高,要求出所有采样点的离群因子计......
对提出的基于马氏距离的点匹配方法进行了理论分析与实验验证,针对马氏距离及加权图转换匹配方法的不足,将马氏距离融入到加权图转换......
基于一级结构信息预测蛋白质热稳定性,对于利用计算机筛选热稳定性蛋白具有重要意义.本文采用κ-近邻算法从序列出发预测蛋白质的......
从序列出发预测水解酶亚家族类型具有重要意义.本文利用不同标度的伪氨基酸组成提取序列特征值,采用k-近邻算法预测水解酶亚家族类......
针对传统协同过滤算法稀疏矩阵和推荐精度不高的问题,根据一种社会心理学模型提出了基于群体动力学的协同过滤算法。该算法综合考......
距离度量对K近邻(KNN)算法分类精度起着重要的作用。传统KNN算法通常采用欧氏距离,但该距离将所有特征的差别平等对待,忽略了数据的......
针对不均衡数据下分类超平面偏移、少数类识别率较低的问题,提出一种基于样本密度的不均衡数据分类算法。该算法首先计算样本密度和......
k-近质心近邻原则是 k-近邻原则的一种有效扩展,是有效的模式分类方法之一。 k-近质心近邻原则容易受到局外点的影响;同时,所有的 k-......
标记间的相关性在分类问题中具有重要作用,目前有研究将标记相关性引入多标记学习,通过分类器链的形式将标记结果引入属性空间,为......
对提出的基于马氏距离的点匹配方法进行了理论分析与实验验证,针对马氏距离及加权图转换匹配方法的不足,将马氏距离融入到加权图转......
为了解决传统分类器的过拟合现象,从而增强分类性能,提出了一种基于核空间中K-近邻算法的混合取样的不均衡数据集分类算法。该算法......
将支持向量机(SVM)引入自动语种识别领域,并在其基础上提出一种改进的SVM——K-近邻支持向量机(KNN-SVM):先利用KNN对训练集进行筛选......
从序列出发预测某蛋白质是否为脂肪酶以及属于哪种脂肪酶具有重要的理论和应用价值。提出了基于Z标度和T标度的伪氨基酸组成方法提......
针对高维小样本大噪声的基因芯片数据,提出一种基于主元分析与k-近邻距离的特征基因选择与去噪方法.首先利用主元分析法获取低维投......
CURE算法是一种凝聚的层次聚类算法,它首先提出了使用多代表点描述簇的思想.本文通过对已有的基于多代表点的层次聚类算法特点的分......
不平衡数据严重影响了传统分类算法的性能,导致少数类的识别率降低。提出一种基于邻域特征的混合抽样技术,该技术根据样本邻域中的......
K-近邻是一种著名的分类算法。由于简单且易于实现,因此其被广泛应用于许多领域,如人脸识别、基因分类、决策支持等。然而,在大数......
入侵检测是一种重要的网络安全技术.现有的无监督方法虽然能在未经标记的数据上找出异常,但时间复杂度相对较高,不适用于入侵检测......