利用聚类算法对电信IM软件用户细分

来源 :山东大学 | 被引量 : 0次 | 上传用户:Hzw_56
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,数据的价值越来越被重视,数据挖掘作为发现数据价值的工具也被广泛的应用。通过数据挖掘发现数据中所蕴含的价值成为各行各业的重要生产力。本文就是通过数据挖掘中的聚类算法根据IM软件的访问次数和使用流量对其进行细分,发现其中的规律和高价值用户群体,以进行差异性服务和营销。数据预处理作为业务和数据理解与模型建立和算法设计之间的桥梁,是数据挖掘中重要的阶段,将会直接影响到聚类的结果。在数据挖掘前,如果不能对原始数据充分理解和分析,并进行相应的处理,则可能得不到好的聚类结果。为了能够把需求和算法很好的结合,文章根据对业务和数据的理解对原始数据进行了预处理,得出最终用于聚类的数据并详尽介绍了这一过程。文章给出了两个聚类算法:K-means和基于LAS-模型的双聚类算法。根据数据的特点,首先选择了传统的K-means聚类算法对数据进行了细分并对聚类结果进行了展示和解读。在利用双聚类算法对数据进行细分时,文章根据2009年俄罗斯学者Shabalin等人提出的基于LAS-模型双聚类算法和本数据的特点,对算法和评分函数模型分别进行了改进。改进之后的算法和评分模型在数据集上有很好的表现,得到的双簇很能反映需求。对算法的改进使得搜索单个子矩阵的算法复杂度有很大的降低。对评分模型的改进不仅使得评分函数模型更能适合本数据集和很大程度上降低了算法的复杂度,最重要的是评分模型改进后可以根据数据集的特点进行参数选择,使得整个算法更加灵活。
其他文献
学位
党的作风建设是一项长期而艰巨的任务,又是一项现实而紧迫的工作。加强党性修养,加强和改进党的作风建设,是全面贯彻党的基本理论、基本路线、基本纲领和实践“三个代表”重
义务教育均衡发展工作在全国的推进力度差别较大,中西部欠发达地区农村义务教育投入连年增加,但一些长期积累下来的生源流失、优秀教师流失、教师岗位被挤占、教师职业缺乏吸
本文主要研究无穷阶下三角矩阵的反演关系,即两个无穷阶下三角矩阵(Fn,k)∈N和(Gn,k)(n,k)∈N(N为自然数集)的互逆关系,也就是主要方法是通过给定矩阵(Fn,k),利用行列式和算法先
有限偏序集的单纯上同调群在研究偏序集的组合性质中具有重要的作用,已经知道有限偏序集的单纯上同调群可解释为有限偏序集的外代数的特殊上同调群,基于这一事实,文[1]中定义了
随着“大众创业,万众创新”会议的召开以及国内网络技术的成熟和繁荣,“互联网+”形式创业的基本条件在我国已经具备。大学生作为对于互联网最为熟悉的一类群体,又极易受到国家
近年来,Banach空间几何理论得到了迅速的发展,到目前为止,一般Banach空间的凸性,光滑性,可微性,粗性,滴性,收敛性的研究相对来说已比较完善,但以某些已知凸性和光滑性为特例的某些k-凸
杨定锋,1962年5月生,湖南茶陵县人,研究生学历,先后在桂林陆军学院、广西边防、42集团军、国防科技大学、湖南省政府财贸办学习、工作,现为湖南省人民政府金融工作办公室机关党委专职副书记、处长,省书法家协会会员,省金融书法家协会理事。  杨定锋从小喜爱书法,多年临摹柳公权、欧阳询、王羲之、米芾等名家字帖,循序渐进、稳步笃行,多年的执着与勤勉,以及从小练就的童子功,使其书艺得以深植广汲,终于聚沙成塔
班主任是班级的中心,班级整体水平与班主任的管理息息相关,由此可见班主任班级管理工作的重要性,这也是学校管理工作的一部分.职业教育为国家发展做出了巨大贡献,也受到越来
报道了活体微生物、微生物代谢产物、疫苗等微生物制剂在淡水养殖中的应用 ,从水质调节、疾病防治 ,作为饲料和饲料添加剂等几个方面探讨了微生物制剂在淡水养殖中的应用前景