论文部分内容阅读
面对日益庞大的数据资源,数据挖掘技术应运而生。它是一种致力于数据分析和理解、揭示数据内部蕴藏知识的技术,是当前人工智能领域和数据库领域相结合的热点研究课题。并且,已被广泛运用于定向市场营销领域。通过各类数据挖掘技术,如回归、决策树、神经网络、关联规则等,可以为定向市场营销的各种业务需求建立响应模型,计算客户或者商品的潜在价值(即响应分值)。从而,有针对性地做出决策,提高定向市场营销活动的效率,降低营销成本。粒度计算的思想产生于20世纪70年代,并得到了迅速发展和广泛应用。它的基本思想是模仿人类思考问题的方式;即人们能从极不相同的粒度上观察和分析同一问题,而且能够很快地从一个粒度世界跳到另一个粒度世界,往返自如,毫无困难。近年来,人们开始将粒度计算应用到数据挖掘领域中,并初步取得了一些成果,成为当前数据挖掘领域一个新的研究方向。本文的主要工作是将粒度计算引入响应建模,并做了一些相关的研究,主要内容包括;1)为姚一豫教授提出的一种线性响应模型——市场价值函数设计了通用算法框架,用于对多种效用函数及权重函数进行组合,计算市场价值。并基于该框架,选取u_a~1和w_a~1作为效用函数和权重函数,给出市场价值函数1-1算法(Market ValueFunction 1-1 Algorithm,MVF11A)。2)将粒度计算中的粗糙集思想引入响应建模,提出一种时间复杂度为O(nm)的粒度排序算法(Granular Ranking Algorithm,GRA)。该算法以构造一种基于粗糙集的响应模型——粒度排序函数(Granular Ranking Function,GRF)为核心。进而由该函数指导测试样本集完成排序。采用KDD Cup所提供的标准数据集对新算法和市场价值函数进行对比测试之后,新算法的正确性和有效性得以验证。与传统数据挖掘技术相比,新算法保留了响应建模的众多优势,排序结果可读性强,阈值易于确定。与线性市场价值函数模型相比,新算法的计算结果精度与之逼近,而时间开销远低于后者。因此,粒度排序算法可以用于定向市场营销等问题的研究,识别客户和产品的潜在价值。3)通过对粒度排序算法进行扩展,提出一种时间复杂度为O(nm)的粒度集合并算法(Granular Set Combination Algorithm,GSCA),形成增量式粒度排序算法(Incremental Granular Ranking Algorithm,IGRA)。通过增量测试,该算法的正确性得到验证。因此,该增量式算法可以解决实际生产环境中,因业务数据规模递增而需部分更新响应模型的问题。对于数据集规模过大而无法一次性完成粒度排序的问题亦是很好的解决方案。