聚类算法及其在客户行为分析中的应用研究

被引量 : 22次 | 上传用户:maenzehai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中一项重要的技术。聚类的任务是把数据集中的对象组成多个有意义的子类,在同一子类中的对象彼此相似,不同子类中的对象不相似。本文重点研究了聚类分析中的两项关键技术:聚类中心点初始化和孤立点检测,同时探讨了它们在客户行为分析中的应用。本文分析了聚类中心点初始化的必要性,以及现有的三类聚类中心点初始化算法。在此基础上,融合了基于网格的聚类算法和基于密度的聚类算法的基本思想,提出了基于动态网格生成技术的聚类中心点初始化算法DGICC。该算法采用动态网格的生成技术,通过计算连通密集区域的重心来生成初始的聚类中心。仿真实验表明,与现有的算法相比,DGICC能更有效减少K-means算法的迭代次数,获得较为理想的聚类精度。同时随着数据集实例数、维度的增加,算法的时间复杂度呈近似线性增加。同时,在分析了现有的几类孤立点检测方法的基础上,针对其对高维数据处理的不足,本文提出了基于转换聚类的孤立点检测算法ODCC。该算法将孤立点问题定位在转换空间中,通过考察距离分布差异获取孤立点。实验结果表明,与现有的孤立点检测算法相比,新算法在孤立点的寻找能力和时间复杂度方面均有较优表现。本文最后探讨了聚类分析技术在客户行为分析中的应用,并给出了一个聚类技术在电信账务数据上的分析和挖掘实例。该实例融合了本文所提出的新算法:基于动态网格生成技术的聚类中心点初始化算法DGICC和基于转换聚类的孤立点检测算法ODCC。
其他文献
本研究旨在初步探讨当今高校应届毕业生择业效能感的现状及影响因素。为高校应届毕业生择业就业心理指导提供理论支持,给相关部门提出建设性的建议。本研究以835名高校应届毕
随着我国经济的迅速发展,公路网设计方案的风险评价也日益增多,但是很多风险评价没有考虑不确定性,造成评价的不完善。本文采用区间数不确定性度量来评价风险,对公路网设计方案具
随着创客教育的不断深入,在小学开展创客教育已经成为小学教育改革的的重要组成部分,对于小学生综合素养的提高和动手操作能力的培养具有积极的意义。小学创客教育中低年级的
随着互联网上各类业务应用和专用网络的高速发展,传统单一的网站式可用带宽测量方法已经难以满足实际需要。由于传输模式不同、服务要求不同,各种网络应用对网络性能指标的感受
行业协会是以市场为边界、以行业为标识的同行业企事业单位为实现行业的共同利益目标,在自愿基础上依法组织起来的非营利性、非政府性、互益性的社会中介组织。行业协会能有
王禹偁(954~1001)是北宋诗文革新运动的先驱,无论是在理论上还是在创作实践上,他都开北宋诗文革新运动风气之先。近三十年来,学术界对王禹偁的生平、思想及其诗文创作理论、特
在三年阅读儿童文学的过程中,我发现一个很奇妙的现象,那就是许多童话的发生地往往是那些被我们所忽视或遗忘的角落:比如地板下,壁橱里,窗户外,甚至是北风之后等等。我把这些
随着科技的进步和发展,机器人在人类的生产生活中扮演着越来越重要的角色,尤其是在太空、水下等特殊场合下,机器人更是发挥了重要的作用。这些场合的恶劣环境,对机器人控制系
民办高校在进入二次创业发展的过程中,如何建立与之相适应的具有自身特点的教师工资激励机制已成为民办高校教师管理的重大课题之一。本文以陕西省民办A学校为主要研究对象,
随着现代桥梁正朝着大跨径、更轻巧的方向发展,斜拉桥因其本身所具有的特性成为实现这一目标最为常用的桥梁结构。主梁、索以及支承缆索的索塔是斜拉桥的主要组成部分。然而,