基于R语言的电信用户数据挖掘应用

来源 :第七届中国R语言会议(杭州会场) | 被引量 : 0次 | 上传用户:xiao_zhuang_lin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  2013年我们移动通信用户总数超过10亿大关,而预计今年用户总数将会增加至20亿.如此庞大的用户量必然产生了巨大的数量.作为数据挖掘应用的重点行业,电信业如何利用这个庞大的原始数据,针对不同的客户采取不同的营销策略,从而为公司增加收益呢?对于电信公司来说,用户新增入网之后,将会经过三个阶段,分别是新增入网时的成本投入阶段,之后到成熟稳定的价值贡献阶段,最后用户就会逐渐衰退流失,为零负收益阶段.显然,用户在稳定期时收益贡献率最高,那如何判别新增入网的用户之后是否会成为这个时期的稳定用户呢.本报告通过观察,先定义稳定用户为在网时长24个月以上用户,作为用户的稳定性标识,从800万数据中抽取1.
其他文献
  近年来,我国河北秦皇岛扇贝养殖水域发生的大规模褐潮使我国成为世界上第三个受褐潮影响的国家,当地扇贝养殖产业受到严重危害.在对褐潮期间扇贝养殖水域浮游植物种群结构
会议
目的:疼痛作为一种对经济社会产生重大影响的健康问题,越来越受到人们的关注,尤其是由疼痛所引发的各种不良的情绪反应,更是困扰着人们的身心健康。因此对痛情绪机制的研究显
  青绿藻(prasinophytes)是一类重要微微型真核藻类,在海洋初级生产中占据重要地位,但在热带-亚热带的南海未见系统研究.本研究综合运用独立于纯培养和基于纯培养等手段系
  CTR(点击率)预测是推荐算法中的重要环节,也是个性化推荐引擎的核心组件,对召回商品CTR的准确预测会直接提升用户体验和网站收益。与其他语言/平台相比,R语言提供了强大
会议
  在搜索引擎服务中,对返回结果的排序是非常重要的一个环节。早起的排序规则通常是基于对业务的了解和不断尝试而手动定制的。随着机器学习领域的不断发展,最近几年排序学习
  R语言最初因为其矩阵运算和内置统计模型、作图引擎的优势兴起于学术界,经历了一段曲高和寡的日子。但本质上,R的风格井不学术,反而由于其深刻地权衡了开发时间与运行时
会议
木聚糖是半纤维素的一种最主要的成分,是除了纤维素以外含量最高的可再生资源,以木聚糖为底物的木聚糖酶是一种非常重要的酶,在快速工业化的过程中有很大的发展应用潜力,因此得到
原药行情的结束现在是一年比一年来得早,从前几年的儿童节涨价潮结束到这几年的劳动节就进入淡季,今年感觉是没有过完清明节就淡下来了。涨价潮对农民来说并不买账,走访了数
目的探讨全反式维甲酸(all-trans-retinoic acid, ATRA)是否通过细胞外信号调节激酶(extracellular signal regulated kinase, ERK)通路调控糖尿病模型大鼠动脉壁肌球蛋白轻
  R官方网站的第一句话是这样介绍R语言的:“R是一个用于统计计算和绘图的自由软件环境.”这句话正好突出了R的两大特色:数据分析和数据可视化.经过长年的开发和完善,目前R主
会议