面向文本分类的k近邻查询方法研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:alanhoo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网上信息量的爆炸式增长和空间信息科学的发展,在很多应用中都需要求给定对象的kNN和RkNN,如在文本分类、智能导航、现代通讯、交通控制、气象预报等各个领域都有着广泛的需求。  kNN查询在文本分类研究等领域有十分重要的应用。kNN问题不仅研究得较早,而且对于它们的商业应用已经相当的广泛和成熟。目前比较常用的文本分类技术主要有:向量空间模型、k最近邻法、神经网络、支持向量机和贝叶斯算法等。而kNN算法是一种有效地文本分类算法。针对传统kNN算法存在计算量过大的缺点,论文引入了生成代表样本集的方法,对原始训练集进行裁剪并予以取代,从而减少了分类系统的计算量,有效地提高了系统的效率。  近年来,移动设备和无线网络的广泛应用带来了基于位置服务应用(LBS)的快速发展,RkNN查询在LBS中扮演了极为重要的角色。然而现有的RkNN算法一般都是近似的解法或者仅仅适用于某种特定的情况,因此在一定程度上存在以下的不足和缺陷:仅适用于二维空间数据的求解;对k的值有限制;支持静态数据而不支持数据库的动态更新,尤其移动对象数据库;仅能得到近似不能得到精确的结果。为解决这些问题,本文给出了一种能够有效解决多维移动对象RkNN查询的新算法——基于半空间修剪的移动对象RkNN连续监测算法。该算法为每一查询点目标分配一个安全矩形区域,对原有的半空间修剪策略进行改进,使其性能优化,并采用过滤、提炼这两个处理步骤来获取查询点的反向k最近邻,实现了对查询点的RkNN连续监测。
其他文献
随着校园网建设的迅速发展,校园网信息资源迅速增加,这使得全校师生迅速定位有价值的信息难度较大,浪费时间而且效率低下。基于校园网自身的特点,发展较成熟的通用搜索引擎不能完
随着通信业务的广泛应用和网络制式的不断发展,通信网络的规模和复杂性迅速增加,网络运行中产生的故障告警的类型和规模也在急速增长。因此必须对通信网告警信息进行智能化管理
随着Web服务技术的发展与应用的普及,服务数量迅猛增加,给信息服务带来越来越大的压力,这就需要通过改进 Web服务的描述方法,对Web服务进行有效的管理,消除服务冗余,减轻网络负担,提
近几年来出现了许多基于不可靠的数据报传输的应用程序。这些应用都是对延迟敏感的程序,包括Internet电话,实时视频会议和在线游戏,比如Startcraft和Quack。然而,SSL/TLS协议是基
移动Ad Hoc网络是一个多跳的、自组织、无中心的网络,它不依赖于任何固定的基础设施便能实现网络的快速组建。网络中的移动节点同时具备路由器和主机两种功能。Ad Hoc网络中节
用溜井溜放矿岩,简单方便,安全可靠,通过能力大、能充分节省资源,经营费用低,故溜井在矿上开拓中得到广泛的应用。它与平硐、竖井、斜井、斜坡道等主要开拓井巷配合,可以构成各种灵
通信技术和计算技术的迅速发展,使得网络领域产生日新月异的变化,极大地推动了人类社会的发展,而无线局域网技术作为一种新兴的网络接入手段,以其移动性、灵活性、经济性等优点更
敦煌壁画以其极高的艺术研究价值,在国内外享有很高的声誉。然而,在人类活动和自然环境的双重影响下,很多石窟壁画糟到破损,急需保护。目前,浙江大学与敦煌研究院进行合作,共
基站是现代移动通讯的基础设备,基站管理水平直接决定移动通讯服务的质量和效率。基站维护管理信息系统是管理和维护通信基站的信息系统,对提高维护效率、降低维护成本具有重要
指纹识别是目前应用最为广泛的生物特征识别手段,通过它可以快速准确地鉴定一个人的身份信息。但是自动化的指纹识别需要大规模的指纹数据库作为算法训练库,而采集指纹数据涉及