移动通信客户流失分析中的数据预处理方法研究

来源 :第二十二届中国数据库学术会议 | 被引量 : 0次 | 上传用户:jiangjiao610329
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据预处理对于数据挖掘至关重要,它直接影响着挖掘结果的准确性和模型可用性.本文以基于决策树算法的移动通信客户流失分析系统为应用背景,提出了分类建模和采用"样本放大"方法进行抽样在流失分析中的重要性.针对决策树算法无法处理与时间相关属性的弊端,提出了趋势属性的概念并给出了采用带权最小二乘法生成趋势属性的方法.
其他文献
VC基金近二十年前开始在中国投资,行业的投资跨度很大,包括半导体、新能源、消费品、TMT、医疗都曾经是VC投资的一些热点,在每个特定时期,投资人都在寻找可能爆发性成长的行
期刊
CE:此次被双汇国际收购,可谓SFD在国际化方面的重大举措,你们什么时候开始走向国际化道路?rn拉里·波普:1998年我们进入欧洲,那年收购了一家法国公司,几乎同时进入加拿大,还
目前,中国经济处在一个关键的转折点上,要实现可持续增长,中国必须告别过去的增长方式.多年来,中国经济增长的原因与经济风险的恶化的原因相同,两者是同一个增长模式的两个方
面对全球最有吸引力的市场,即使是全球最成功的公司也不得不破例。一向高傲的苹果公司,终于还是低了头。4月1日晚,苹果公司的中文官网上贴出了首席执行官蒂姆·库克署名的道
本文针对纯粹采用网页内容的聚类方法,通过对搜索引擎查询日志的挖掘,将查询作为网页的附加特征向量,以迭代的方式逐步修正,极大地提高了网页聚类效果.
挖掘约束(约束最大)频繁项目集是多种数据挖掘应用中的关键问题,本文提出了一种快速的约束最大频繁项目集挖掘算法MCMFISA,并举例说明了算法的执行过程.至于约束(约束最大)频
前两天在无锡,我去参观红豆集团,才知道中国纺织面料行业中规模以上的公司(年营业额500万以上),有6 7万家.这说明这个行业是高度分散.因此这个行业进行整合,淘汰一部分企业是
期刊
为了挖掘大型事务数据库中数据间所有的关联规则,本文提出了一个新的算法BOM算法,并且与经典的挖掘关联规则算法Apriori算法做了对比.BOM算法具有良好的性能,它不需要多次扫
本文以规则学习算法RIPPER为基础,提出一个改进的规则学习算法hRIPPER,其中重要的一个部分就是层次特征选择算法HFS,它为每个层次上的每一个类获得一个相对较小的特征项集合,
为了解全县农村饮用水卫生状况 ,为加快农村集中式供水基础设施建设提出可靠依据 ,2 0 0 4年 5月 18日~ 6月 8日对全县 2 6个乡镇 4 30个行政村(居委会 ) 5 0 9895人生活饮用