【摘 要】
:
数据挖掘是从数量庞大的、随机出现的、客观存在的、不完全的并充满噪声的数据中提取和发现有价值的信息,从而为商务分析与决策、自然科学理论、人文地理等提供有效的技术支持
论文部分内容阅读
数据挖掘是从数量庞大的、随机出现的、客观存在的、不完全的并充满噪声的数据中提取和发现有价值的信息,从而为商务分析与决策、自然科学理论、人文地理等提供有效的技术支持和可靠的数据依据。其中,聚类分析是数据挖掘中一项十分重要而有趣的研究课题,并且因为其强大的应用和研究价值而受到越来越广泛的关注。
为解决网格聚类算法中对参数过于敏感、无法自动识别不同密度梯度类以及不同梯度类间划分不够精确等问题,提出了基于最优划分的多密度梯度网格聚类算法(OPMDG)。该算法只需用户输入一个大致的密度阈值范围,网格边长自动计算并可自动调节适应,减少了算法对参数的敏感性;提出了二重划分技术,可挖掘不同密度梯度的类;对于处于不同类上的交界点,引入了电荷间吸引力的概念,能有效解决类间聚类精度不高等问题。
实验结果表明,OPMDG算法能识别各种不同形状、大小的簇,挖掘具有不同密度梯度类,并能有效地划分边界和去除离群点与噪声点。在通过和GCOD算法的对比中,可以显著发现OPMDG算法的精度和准确度更高,且时间复杂度是一个不大的线性函数。
其他文献
研究房价波动对消费的影响主要涉及投资需求和消费需求即房地产市场投资和居民消费领域,是关乎居民住房和消费迫切需要解决的问题。本文正是基于这一背景,深入研究湖南房地产价
良好的数学课堂直接关系到教学的成功,在数学教学中集中了教师的理念、智慧、机智和经验等各方面的要素.课堂是每一个生命个体创造出来的优质教学资源,课堂上学生能否学到知
随着图像获取技术与传输技术的快速发展,图像处理技术不仅被广泛应用于军事遥感、工业机器视觉、交通监控、指纹识别等领域,而且已经进入到人们的日常生活中,譬如数码照相、文件
重新排序是排序论中的新兴研究课题.由于其重要的理论研究价值及广阔的实际应用背景,在过去的十年里,重新排序得到广泛的研究。重新排序模型可以描述如下:生产计划者已经将一
本文基于CBC(Convection Boundedness Criterion)准则和TVD(Total VariationalDiminishing Constraint)准则,结合Hermite插值,利用经典的CUI格式构造了一种新的分段的高分辨率
自从我国小学开始实施新课程教学改革之后,大部分的英语教师都在为提高学生的英语成绩寻找方法.英语作为一门外语,大部分的小学生从小来说并不会有机会接触,因此在教学进行的
数论中的指数和,Kloosterman和,Guass和,Ramanujan和等和式都有紧密的联系.近年来,很多学者深入的研究了这些问题,并且获得了很多优秀的研究成果.本文运用简化剩余系,三角和,Dirichl
本文主要从数学上研究了无形体病的病原学和流行病学,并建立了相应的数学模型.我们分别考虑了具有Holling-II功能反应的三种群无形体病模型和具有Holling-II功能反应的两种群
随着经济的快速发展,我国石油化工行业也获得更大的发展空间,石油化工项目的规模也越来越大,效益也在不断的增加,因此对于工程项目的管理模式也提出了更高的要求.EPC总承包模
分布近似在概率论与数理统计中是一个重要的分支,它在统计学科研和实践中都是很重要的工具。Stein方法是一种很有用的可用于分布近似的方法。Stein方法可用于考察随机变量的