【摘 要】
:
从海量的零售信息中提取有意义的数据为企业营销创造价值是众多企业共同需要解决的问题,然而面对海量数据如果仅仅采用传统的统计方法来分析不仅无法满足大数据环境下高效处
论文部分内容阅读
从海量的零售信息中提取有意义的数据为企业营销创造价值是众多企业共同需要解决的问题,然而面对海量数据如果仅仅采用传统的统计方法来分析不仅无法满足大数据环境下高效处理的要求,而且往往很难得到想要的结果,同时由于海量数据中存在的模糊性与不确定的表达将使得数据建模变得更加困难,也就无从开展精准推送营销,基于此本文从海量的零售数据中提取衡量客户价值的RFM模型指标,通过RFM模型指标提取客户特征属性构建用户画像标签,对用户画像标签的模糊性与不确定性通过云模型和本体思想来构建用户画像模型,从而实现面向消费市场的精准推送。具体研究内容如下:(1)数据预处理:如何从海量的零售信息中提取用户的共同特征,本文从海量的零售信息数据库中按照分层抽样的思想随机抽取具有代表性的样本数据,在保证抽样数据符合标准格式要求的前提下,重点研究了在海量数据环境下如何实现最优分配以及如何对抽样性能评估,保证样本数据在一定条件下能够反映全量数据的整体全貌。(2)用户画像标签处理:从抽样数据中提取RFM模型指标,针对抽样数据中该类指标的不确定性与模糊性的特点,本文引入云模型理论和本体技术,通过高斯云发生器将RFM指标转换为基于云模型的RFM指标(时间间隔云模型、消费频率云模型、消费金额云模型)来构建群体价值画像标签体系,通过本体思想对用户属性进行表示、解释和推理来构建用户个体画像标签体系。(3)用户画像建模:用户画像力求借助用户个性化的标签来反映用户信息全貌,标签的选取直接影响用户画像的建模的成功与否,本文基于云模型的RFM指标构建用户价值画像模型,同时通过用户个体属性来构建个体用户画像模型。为了对云模型领域的用户画像聚类分析,本文对传统的K-Means聚类算法进行改进,设计了基于云模型的聚类算法。在该算法的基础上可以根据具体的业务场景得到不同的用户画像模型。(4)精准推送阶段:通过云模型画像聚类对客户群体进行价值分类,建立群体与服务之间的关联,通过本体推理对零售户建立个体与产品之间的关联,实现由服务(群体)到产品(个体)的二级推荐。
其他文献
轧机异常振动故障在薄规格板带生产中经常发生,不仅严重影响连续生产的稳定性,且使生产条件恶化,缩短轧机机械、电器及液压等原件寿命。研究如何预测、分析与消除轧机异常振
纯电动汽车已经成为汽车研究与开发的热点。控制策略作为纯电动汽车的关键技术对纯电动汽车的动力性、经济性、安全性和稳定可靠性起到极为重要的作用。高效的开发方式与建模
根据企业业务活动的性质和现金流量的来源,《企业会计准则第31号——现金流量表准则》将企业一定期间产生的现金流量分为三类:经营活动现金流量、投资活动现金流量和筹资活动现
对无人机螺桨噪声的主动控制技术进行实验研究。针对某型国产无人机,通过对其发动机螺桨噪声的测量分析,设计并开发了一个四入二出的主动噪声控制系统。利用该系统,在实验室
Natural polyphenol has been widely believed to be effective in allergy remission. Currently, most of the natural polyphenol products come from terrestrial sourc
A study is presented on the modulation of ripples induced by a long surface wave (LW) and a new theoretical modula-tion model is proposed. In this model, the wi
介绍了数据加密DES算法的产生、安全性、发展及实现.着重论述了算法的分析和实现过程,用实例展现了复杂算法的实现步骤,有助于加深对DES算法的感性认识.并对DSE的安全性做了
随着混合动力技术的发展,发动机和电机作为整车的动力系统,通过整车控制切换整车动力源,电机作为瞬态功率的主要输出,发动机主要在稳态工作,以提高经济性和排放性。目前电机
It is generally believed that the equilibrium range of wind wave spectrum is in the form of the-4 rather than-5 power law.However,in the widely applied P-M spec
定义了模糊集序列的更为广泛的收敛性概念,引进了模糊集连续以及一致连续等概念,并且在连续的条件下推出了这几种收敛性间的关系,这对讨论模糊随机变量序列的收敛性有重要意