【摘 要】
:
消费贷款产品在我国的需求量与日俱增,在众多的消费贷款产品中,为用户推荐满意的产品是一个不小的挑战。现阶段,在各种主流的推荐算法中,协同过滤算法是应用较为广泛的一种推荐算法,但是传统的协同过滤存在用户数据稀疏性的问题,导致用户相似度计算的精准度降低。针对上述问题,本文在教育部-中国移动集团科研基金项目支持下,利用移动运营商网络数据,提出基于密度峰值聚类算法(Density Peaks Cluster
论文部分内容阅读
消费贷款产品在我国的需求量与日俱增,在众多的消费贷款产品中,为用户推荐满意的产品是一个不小的挑战。现阶段,在各种主流的推荐算法中,协同过滤算法是应用较为广泛的一种推荐算法,但是传统的协同过滤存在用户数据稀疏性的问题,导致用户相似度计算的精准度降低。针对上述问题,本文在教育部-中国移动集团科研基金项目支持下,利用移动运营商网络数据,提出基于密度峰值聚类算法(Density Peaks Clustering Algorithm,DPCA)的消费贷款产品推荐模型。主要研究内容与贡献如下:(1)提出并设计实现基于DPCA聚类的消费贷款产品推荐模型。在协同过滤推荐模型的用户分类过程中引入DPCA聚类,利用用户移动数据提取用户的消费行为特征,其中包括用户购物倾向与购买力两大类特征。基于以上特征,通过DPCA聚类方法将用户进行聚类划分,使对消费贷款产品需求相似的用户,即相似度较高的用户聚集到同一个类中,简化查找最近邻居过程,提高用户相似度计算的精准度,从而提高了推荐结果的准确性。(2)设计实现基于改进DPCA聚类的消费贷款产品推荐模型。传统的DPCA聚类具有:不能处理混合属性数据集、类簇中心与噪音点难以区分、截断距离选取不确定性和单一聚类的精准度较低等问题。为了提高用户划分的准确性,针对以上问题对DPCA聚类进行改进,提出了:基于信息熵的混合属性对象间的距离度量方法、基于两次残差分析的聚类中心识别方法、基于GA的最优截断距离获取方法以及一种基于最小生成树的聚类集成方法。从而,进一步提高推荐模型的推荐准确性。在合作方公司提供的数据集与公共数据集上进行实验,以平均绝对偏差(MAE)值、ARI指数和FMI指数为评价指标,验证了本文模型的有效性。总之,针对协同过滤算法与DPCA聚类算法的不足,本文分别提出了相应的解决方案,并通过实验验证本文提出的方案能有效地提高推荐结果的准确性,在推荐领域研究方面具有一定参考价值。
其他文献
2004年12月阜新一家工厂管道破裂造成砷污染了饮用水,部分人因饮用被污染的水及食用了被污染的水做的饭菜而引起砷中毒。应用徐伯洪主编的《工作场所有害物质监测方法〉中尿中
本文从档案征集内容的复杂性、地方的不确定性、范围的广泛性、时间的久远性等方面论述了档案征集工作的难度。并对档案征集工作提出建立健全网络,加强宣传力度,加强领导和经
<正>一是重视全面性分析,增强风险意识。做到两个"确保":一方面确保风险管理能够涵盖所有部门、所有业务和所有环节中的一切风险;另一方面确保风险管理能够识别包括市场风险
本文以农业银行泰兴市支行为例,分析了县级支行内部控制工作中存在的问题,提出了增强县级支行内部控制能力的相关建议。
目的:脑出血(Intracerebral hemorrhage,ICH)是指脑组织的自发性出血,起病危急,预后不良,有着较高的致残率和病死率。脑出血后继发性脑损害是造成脑细胞死亡和脑功能缺损的主因
目的:通过使用Revolution CT对肺结节患者进行GSI平扫及动脉期、静脉期双期增强扫描,并利用后处理软件进行能谱的多参数定量分析,判断Revolution CT能谱成像技术对肺部炎性与恶性结节的鉴别诊断及肺癌病理分型的价值。同时通过比较肺部GSI平扫及双期增强扫描与常规肺部平扫及双期增强扫描在辐射剂量方面的差异,进一步探索Revolution CT能谱成像技术在低剂量扫描方面的价值。方法:
<正> 随着社会信息化程度的不断提高,档案这种原始的信息资源越来越受到人们的重视。而信息高速公路的建立与开通,人们工作方式、学习方式以及利用档案方式上的变化,也迫切要
亲属作证豁免权,又称之为“亲属拒证权”或“亲属作证特免权”,是证人作证豁免权的组成部分,指具有证人资格的人由于与被告或者犯罪嫌疑人有法定亲属关系而享有的作证义务得
农村留守儿童在身心发展方面都存在一些问题。留守儿童问题关系到农村的物质文明和精神文明建设及可持续发展。解决留守儿童问题,需要加快农村经济发展,同时应大力改善农村学校
目的 :探讨精神分裂症患者 P3异常的意义 ,以及抗精神病药物可能的影响。 方法 :对2 1例精神分裂症患者在发病期及 2年缓解期后采用视觉图像辨认作业引出 Cz点 P30 0 进行研