分类数据聚类边界检测技术研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:qyxiao3771
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和信息技术的迅猛发展,人类社会进入了信息时代。信息时代的一个显著的特点就是人们所面对的信息和对信息的需求剧增。如何从这些信息中获取有用的知识是人们需要解决的一个问题。数据挖掘技术可以较好的满足人们对信息提炼的需求。聚类是数据挖掘中一个重要的分支,而聚类边界检测是对聚类的进一步的细化。聚类边界是一个新兴的研究方向具有广泛地应用前景,可应用于生物学、传染病学、统计学、基因工程等多个领域。聚类边界是具有多个聚类特征的数据对象,对这类数据对象的研究具有实用价值。例如:进行产品市场调查时,可以通过对这类对公司产品感兴趣但并没有成为公司消费者的被调查者的信息特征进行分析,并相应调整公司营销策略来争取这类顾客,比盲目的争取那些对公司产品没有丝毫兴趣的消费者的成功率要高得多。聚类边界检测算法是一种提取该类数据对象的方法,本文针对现有聚类边界算法中的以下两个方面进行相关研究并取得相应的成果,具体如下:1.针对目前对聚类边界的研究主要集中在对数值类型数据的聚类边界的检测而尚未对分类数据聚类边界进行相关研究的问题,本文对分类数据聚类边界进行了相关研究。给出了表征分类数据对象同所属类亲疏关系边界度定义和分类数据聚类边界的形式化定义,利用证据积累的思想提出了一种针对分类数据的聚类边界检测算法——CBORDER。在多个真实数据集上的实验结果表明算法可以有效的提取高维分类数据集中聚类的边界。2.针对现有算法对边界的提取精度不高和不能有效去除噪声的缺点,结合BRIM算法中的正、负半邻域思想和EDGE算法中的联合熵的思想的基础上提出了一种新的聚类边界检测算法·——EBRIM。通过多个数据集上的实验的对比结果表明EBRIM算法在聚类边界提取精度和有效去除噪声两方面都明显优于BRIM算法和EDGE算法。
其他文献
药物副作用是病人在治疗的过程中按照正常的药物剂量进行诊断、预防、治疗某种疾病所出现的与治疗目的无关的反应,一般会引起患者的不适和痛苦。美国的一项关于药物副作用的研究表明严重的药物副作用是引起人类死亡的第四大原因,每年会引起1,000,000人死亡。因此,药物副作用逐渐成为公共健康的主要问题,其不仅是药物研发失败的主要原因,同时也是新药研究与投产的主要阻力。目前,对于药物副作用的研究主要集中在如下三
本课题将图像特征提取算法应用于图像匹配,将移动互联网应用与电子取证相结合,开发了基于移动设备平台的图像取证及匹配系统。本文研究了移动设备进行图像采集、定位以及建立网
当今时代,互联网的技术得到了突飞猛进地发展,人们日常生活中可以像用水用电一样去方便地使用网络,这样就使得互联网业务量也在不断地增长,那么如何处理好这些海量的数据与服务成
自学考试是一种具有中国特色的高等教育考试制度,主要目的是利用考试的方式提高人们通过自己主动学习获得先进科技文化知识的积极性,进而提高我国人民的科学文化素质和思想道
当前,随着互联网技术的发展,企业也在逐步加快管理现代化、信息化建设。企业建立一套完善的信息化系统对企业在日益激烈的市场化竞争中尤为重要。本文结合目前主流的开发平台与
随着计算机网络技术的迅速发展,Internet已成为全球信息传递和共享的重要资源,企业和个人通过网络进行数据交换变得越来越频繁,传统的数据模式不能精确的表示这些数据。XML技术
随着游戏、动画等娱乐产业的快速发展,计算机三维动画广告和片头在电视屏幕上频频播映,计算机三维动画已经走进了人们的日常生活。计算机三维动画在各行各业中的应用越来越广
物联网的对象名解析服务(ONS)是一个分布式系统,它可以提供以下基本的查找服务:现实世界的每一个对象有唯一一个标识符,即电子产品代码(EPC),通过EPC和ONS解析服务可以返回一
伴随着科学计算可视化技术的不断发展,医学影像三维重建技术在疾病珍断、手术导航和辅助教学等方面也开始发挥着越来越重要的作用。其中的三维重建体绘制算法可以将各组织器
随着互联网技术的迅速发展,传统的分布式计算技术已不能满足用户需求,Web服务应运而生并成为面向服务计算的范例。随着Web服务技术的不断发展及其应用范围的逐步扩大,越来越