论文部分内容阅读
在竞争环境激烈的今天,越来越多的中型和小型企业认识到客户管理在企业竞争中的重要性。但对于大多数中小企业来说,建立专门客户管理系统需要专门硬件和专业的技术人员,这增加了企业的成本。而低成本的实施费用,让云计算给企业应用带来了更广的发展空间。基于云计算的CRM不仅能够降低中小企业的业务成本,还可提高中小企业的业务敏捷性,并在此基础之上帮助中小企业开创出新的商业模式和市场机会。另一方面,确切的掌握客户的需求、了解客户的动向,不仅可以在一定程度上降低经济成本支出减少交易风险,还可以维系老客户、发展新客户。现在企业中存在大量的信息,如何挖掘这一巨大的信息中有价值的知识和规则是一项紧迫的难题。数据挖掘技术,解决了上述问题,通过挖掘和分析大量的数据,并发现有价值的客户,并且使用模式和知识来预测客户的需求以达到为企业提供决策的目的。因此,研究和分析数据挖掘技术在云环境下CRM系统中的应用是很有必要的。本文的主要目的是将数据挖掘技术应用到云环境下的CRM系统中。一方面使云环境下CRM系统的功能更加强大,用户可对客户、产品等信息数据进行提取、分析、整理,提取出企业中有用的信息,从而达到为企业决策提供依据,提高了企业的市场竞争力的目的。另一方面,针对传统的Apriori算法在执行过程中存在着需要扫描多次数据库,执行效率低和需要大量的内存来存储候选项集的缺点,有人已经提出了引入索引结构的Apriori改进算法。在本文中我们提出了将基于索引结构的Apriori算法的设计思想应用到Apriori算法MapReduce并行化改进的过程中。该算法的核心思想:将数据进行MapReduce并行化分块,并在每个分块中采用索引的执行模式。该算法结合了索引结构的优点和算法并行化的优点,不仅大大的提高了数据的处理速度,而且实现了在云环境下CRM系统中的应用,为数据挖掘技术在云平台下的应用提供了参考依据。