数据挖掘聚类算法研究与系统设计

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:renyuh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是近些年来发展起来的新技术,通过数据挖掘,人们可以发现数据背后隐藏的有价值的、潜在的知识,为科学地进行各种商业决策提供强有力的支持。当今,数据挖掘已发展成一门跨越多领域的学科,已经成为数据库、模式识别、神经网络、统计学、计算智能等领域的研究者关注的热点。本文首先介绍了数据挖掘研究的相关背景,对数据挖掘中的聚类分析的相关工作作了一个简要的概述,并对处理高维数据的聚类算法进行了较为深入的分析研究。本文针对类别数据的特点,提出了一种基于覆盖率的类别数据聚类算法CCCD。实验结果表明CCCD算法能够有效地处理大量类别数据的聚类问题。并且通过分析CCCD算法的计算复杂度和时空复杂度,我们发现CCCD算法在这两方面较其它聚类算法都有较为明显的优势。针对高维复杂数据的聚类问题,本文对利用神经网络方法进行聚类分析作了较为深入的研究。在传统的SOM聚类算法的基础上,着重研究了基于子空间的神经网络模型ASSOM和PCASOM,并在其基础上提出了一种能够根据不同输入样本的特性自动调整其网络结构的GHPCASOM算法。实验结果表明,这个新算法能够更好的表现数据之间的层次关系,并不需要事先确定其网络结构,有及其明显的特点。本文针对数据挖掘研究和实际应用的需要,研制了一个基于Web的数据挖掘服务系统。本文从系统的体系结构、功能设计、模块划分、实现技术等方面进行了详细的分析和讨论,并展示了部分已经实现的功能。
其他文献
对公司负债估值的传统的方法是折现现金流的方法,但这种方法也存在很多缺陷.或有要求权的分析方法作为一种全新的方法可以克服折现现金流的方法在某些方面的不足.利用二叉树
目的 分析全面护理干预在神经外科患者急救中的应用效果.方法 选取2018年2月至2019年6月93名医院神经外科收治重症疾病患者,随机分为两组,其中观察组共计46例,对照组共计47例
位于川北地区的广旺矿务局,由于资源条件差,开采时间长,历史欠帐多,被列为全国煤炭行业36家特困企业之一,1992年企业亏损高达8384万元。近几年来,在局长吴怀炎及党政一班人的领导下
[摘 要] 培养大学生创新及创业能力是当前社会普遍关注的重大社会问题,它直接关系到我国的社会稳定及中国梦的实现,青年兴则国家兴。为有效培养和提升在校生创新思维及创新能力,在基础教学过程中我们从利用非智力因素提高兴趣激发潜能为出发点、围绕思维培养、改革教学方法以及培养学生创新意识,提高创业能力措施等几方面做了一些研究,旨在探索出一套培养和提升大学生创新及创业能力的基本思路的实施办法。  [关键词]
目的 对PDCA循环护理模式在慢性乙型肝炎护理中的应用效果进行探讨.方法 随机选择我院2018年9月至2019年9月接收的慢性乙型肝炎患者80例,将所有患者根据电脑随机选取方式进行
[摘 要] “统计实务”是经济统计以及经济管理类专业学生参加统计师资格考试必考的一门学科,这门学科涵盖了统计学的基本理论和研究方法,也是学生在校学习的必修专业基础课程之一。根据近几年在课堂上的教学实践以及学生对于课堂的反馈,探索了如何提升独立学院学生对于“统计实务”的学习以及应用。该文主要分析目前独立学院学生在《统计实务》课程教学存在的问题,并探讨大数据时代“统计实务”课程教学改革的具体方法和措施
充分发挥党组织在企业中的政治核心作用,是由我们党的性质和地位决定的,是吸取了企业发展中正反两方面的经验教训而得来的。但怎样才能更好地发挥它的作用呢?笔者认为应当抓
目的 探究自省式健康教育在艾滋病危害宣传与防控中的应用效果.方法 选择2016年1月至2018年12月来我中心进行健康体检的100名艾滋病高危人员作为调查对象,并将其分为对照组和
目的 探讨双心护理模式在行冠状动脉介入治疗患者中的实施效果.方法 选取我院心血管内科2018年3月至12月间收治的428例行冠状动脉介入治疗的患者,按手术单双号将患者分为对照
目的 研究体检中心疾病预防中健康管理措施的运用价值.方法 2018年1月至2019年1月本院体检中心接诊的体检者200名,利用电脑随机双盲法划分成2组,每组100名.试验组实行健康管