一种基于网格的密度聚类算法研究及应用

被引量 : 0次 | 上传用户:mllx03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和数据库技术的迅猛发展,需要分析和管理的数据迅速增多,面对大规模的海量数据,迫切需要一种能够智能地、自动地把数据转换成有用信息和知识的技术和工具,数据挖掘技术应运而生。聚类算法是数据挖掘领域的主要方法之一,研究如何提高聚类算法的性能具有重要的意义。本文通过对密度聚类算法DBSCAN的研究分析,发现该算法在执行的过程中需要为每个数据点计算临域内若干个数据点的相似度信息。当数据量较大时,算法所要求的时间复杂度较高,这个缺陷在一定程度上限制了DBSCAN算法的应用。针对上述问题,本文给出了基于网格的快速DBSCAN算法。该算法在密度聚类中引入网格的概念,给出网格单元的Eps-外围,创建数据分区;接着,对每个分区应用DBSCAN算法进行聚类;然后,根据给出的合并定理对所有局部聚类结果进行合并。最后,将改进后的算法应用于软件失效数据的预处理中,通过聚类降低失效数据中的异常数据点对软件可靠性参数估计过程的不良影响,提高软件可靠性预测的精度。利用实验对改进后的算法与DBSCAN算法进行对比分析,结果表明,改进后的算法在聚类速度和聚类质量方面均优于DBSCAN。
其他文献
本文通过对基层信用社开展电子银行业务中遇到的员工年龄老化、业务熟练度低、服务意识不强、绩效分配不合理、客户认同度低等问题进行分析,而后提出解决措施,以期对基层信用
目的探讨抗感染专业临床药师在面对特殊人群或伴有不同类型的基础疾病的感染患者时,如何参与制定合理的抗感染治疗方案及提供有效的药学服务。方法临床药师参与外科重症监护
本文证明了多维泛函型随机微分方程■当系数σ(t,x),b(t,x)关于t可测,关于x连续且满足一般的线性增长条件时的弱解存在性,同时还给出了当b仅可测时方程弱解存在的一个充分条
本文探讨了企业供应链管理中的基本策略之一———物料采购管理策略 ,提出了一种根据采购物料本身的重要性和供应市场的复杂度来对物料进行分类的方法 ,并针对在此分类下的不
《后窗》(1954)无疑是阿尔弗雷德·希区柯克为数众多的悬疑片中最为经典的一部。正如很多评论者认为,这部影片的特殊性在于它暴露出"窥视"这一基本的观看设置,并利用该设置作
当今世界,国际竞争日益激烈,对人才素质的要求更加严格。随着“依法治国,建设社会主义法制国家”作为我国一项基本的治国方略,明确载入《国民经济和社会发展“九五”计划和2010年远景
B2C电子商务为企业和消费者之间开辟了新的通信方式和交易平台,给人们的工作和生活带来了新的尝试和便利性.伴随着电子商务交易量和交易额的不断增加,电子商务对安全方面的要求
为了探明根系分区交替灌溉不同灌水上、下限对作物生长状况、气体交换与产量的影响,以指导节水灌溉,通过玻璃土箱试验,选取常规滴灌(conventional drip irrigation,CDI)和根
加强食品安全法律治理是当代世界的普遍趋势。为了应对食品安全监管法律的失灵,印度2006年颁布了《食品安全与标准法》。该法在充分借鉴发达国家制度和国际标准的基础上,实行
以宽叶独行菜(Lepidium latifolium L.)的叶片和茎段为外植体,接种于MS培养基上进行愈伤诱导和植株再生培养,研究不同浓度激素对愈伤和再生苗生长状况的影响。结果表明,当激素