空间数据挖掘的机理研究——聚类问题算法研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:xboy123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
空间数据挖掘是指从空间数据库中提取用户感兴趣的空间模式与特征、空间与非空间数据的普遍关系及其它一些隐含在空间数据中的普遍的数据特征。聚类分析是数据挖掘中的一种非常重要的技术和方法。空间聚类分析既可以发现隐含在海量数据中的聚类规则,又可以与其它数据挖掘方法结合使用,发掘更深层次的知识,从而提高数据挖掘的效率和质量。空间聚类分析是空间数据挖掘的重要研究方向之一。本研究主要内容如下: ⑴对空间数据挖掘进行了概述,介绍了空间数据挖掘的理论、方法和研究内容。 ⑵阐述了聚类的概念,系统而完整地分析和总结了主要的空间数据聚类算法的性能、优缺点、计算复杂度以及各聚类算法的应用条件。 ⑶针对DBSCAN算法I/O开销和内存消耗大的缺点,提出了基于层次合并的密度算法。该算法减少了DBSCAN算法中需要查询的点的数量,从而克服了DBSCAN算法I/O开销和内存消耗大的缺点。算法分析表明该算法对DBSCAN的改进是有效的。 ⑷在空间聚类中,最佳聚类数k求解的关键是构造合适的聚类有效性函数。针对典型K-平均算法中的聚类数k必须是事先给定的确定值,然而,实际中k很难被精确地确定,使得该算法对一些实际问题无效的缺点.提出距离代价函数作为最佳聚类数的有效性检验函数,建立了相应的数学模型,并据此提出了一种改进的k值优化算法,实例进一步验证了新方法的有效性。 ⑸提出了一个基于聚类的空间数据挖掘系统的框架,从系统设计目标和系统设计展开研究,采用模块化设计的思想,将系统设计划分为数据访问、聚类、用户交互和知识库管理4个模块;将本文研究的聚类方法集成在一起,为基于聚类的空间数据挖掘方法与应用提供技术支撑。
其他文献
英特网上的信息与日剧增,蕴藏着巨大的信息量。对产品的各种评价出现在各大论坛、电子公告板以及门户网站上,厂商需要了解顾客使用其产品的反馈意见,潜在的购买者也需要做出
语音是语言信息的载体,是人类交流信息最自然、最有效、最方便的手段。在许多情况下,人们所关心的语音信号不可避免地被其他信号所污染,影响了人们的听辨。小波变换在当今信
车间作业调度问题是多任务作业调度问题的一个重要内容,它是指在车间生产过程中对共同使用的资源实行时间分配从而达到某一最优目的。作为一个NP难题(Non-deterministic Polyn
随着新兴电子商务平台和微博、微信等社交媒体的广泛使用,人们在享受互联网技术带来种种便利的同时,也用文字记载了自己的心情、状态、评价和观点,通过挖掘海量微博和评论文
2007年中国网络购物市场十分受关注,越来越多的企业加入网络购物行业,特别是大量传统零售厂商纷纷进军B2C电子商务。B2C购物将成为未来网络购物市场新的增长动力。但目前中小
随着Internet的迅速发展,越来越多的政府部门把关键业务转移到网络上来运行,不断增长的业务量使得网络服务器不堪重负。而单纯靠增加服务器硬件设备来升级系统并不是很现实的
为了阅读宇宙边缘的信息,我国研制了500米口径球面射电望远镜(FAST)。FAST将是世界上最大最灵敏的单口径射电望远镜,其三项自主创新开创了建造巨型射电望远镜的新模式。FAST是一架坐落于贵州大窝凼的可动抛物面射电望远镜,其获取的观测数据将服务于宇宙起源和演化、探索生命起源等多科学目标的研究。FAST是一套500米大小的大型设备,观测细节繁琐,需要为观测用户提供一个规范和可视化观测过程的上层、易
以信息技术为先导的经济信息化、商务信息化、政府信息化等社会变革,对政府公共管理和服务提出了新的挑战,政府运行原理、实现机制和具体手段都围绕着信息化发生了适应性转变,这
无线传感器网络技术作为一种全新的信息获取和信息处理、传输技术,具有组网快捷、灵活,且不受网络约束的优点,可用于紧急搜索、灾难救助、军事、医疗等领域,具有广泛的应用前景,被
智能手机在给人们的生活带来了便利的同时也遭受到了严重的安全威胁,恶意扣费、隐私窃取、系统破坏等层出不穷的恶意攻击手段给手机用户造成了严重损失。Android作为一个开源