基于相似度和评分预估的推荐算法改进研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:kjtx123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在面对大量信息所造成的信息过载时,推荐算法是最为有效的一种解决方式,通过记录用户的操作行为经过计算,推测用户可能感兴趣的信息。在众多推荐算法中协同过滤推荐算法是目前使用最广泛的推荐算法,但该算法也存在诸如数据稀疏性、算法可扩展度、推荐精确度等问题,本文主要针对基于引导式相似度推荐算法和基于近邻预估评分推荐算法中存在的推荐精确度不足的问题,提出了两种改进的算法模型DEI和IFSP,并在实验平台中实现两种算法的组合使用,具体研究内容如下:1.对引导式相似度衡量推荐算法模型原理进行深入研究,针对改算法中对显著度计算和离散度计算不精确而导致推荐准确度下降的问题提出一种新的差异化评价指数推荐算法模型(DEI)。该算法的基本思想是结合评分的差异值和评价兴趣偏好相似度,目的是解决原有算法模型中显著性和离散性对推荐精确度造成的负面影响。首先,算法根据差异化评分值和对相同物品的打分值是否相似来衡量物品评分系数的相似程度,其次对整体的数据集分析了用户兴趣偏好差异,最后考虑了用户间共同评分项目所占比例对相似度计算的影响采用jaccard系数来降低这部分因素对推荐精确度造成的影响。测试选取多组样本实验数据在多种推荐算法模型下进行MAE值对比,实验结果证明DEI算法模型得出用户相似度的精确程度更高,并在一定程度上降低了数据稀疏问题对推荐信息质量的影响。2.对近邻预估评分推荐算法模型原理进行深入研究,针对改算法在计算预估评分时没有考虑到未打分物品与用户已经打分物品的相似性而导致的预估评分值精确度下降问题,提出一种新的基于物品相似类预估评分推荐算法模型(IFSP)。该算法的思想是通过对相似物品聚类构建评分矩阵,把等待预估评价物品与用户已评价相似类物品的数目作为物品的权重,再结合特定用户相似度,对预估评分进行合理的调试,优化预估评分模式。测试选取多组样本实验数据在多种预估评分模型下进行MAE值对比,实验结果证明IFSP预估评分方式显著提高了预估评分的精准性。3.基于改进的DEI算法模型和IFSP算法模型,选用spark2.0计算框架实现两种改进算法模型的整合。通过在多组样本数据集群下进行测试得出结果,证明了整合的算法模型在实际应用时能够有效改善系统计算效率,提高了算法的可扩展性。
其他文献
<正> 由于我国幅员辽阔,煤田赋存条件千差万别,又加之建设时期不同,在技术条件、开拓方式、井型大小以及机械化程度等方面差异较大。因此,在当前设计概算尚不能起到控制基建
在雷达动态性能检验和评估试验中,采用GPS定位实现对雷达测量精度和测量特性状态的标校,是一种常见的方式。普通GPS接收机的定位精度由于美国SA干扰、电离层滞后、对流层滞后
改革开放以来,公共服务提供主体和提供方式伴随着我国公共服务体系和公共服务制度建设的不断推进,呈现多样化的发展趋势,到目前为止,我国已经初步形成了政府主导、社会参与、
煤炭部财务司副司长朱登山同志,于去年十月带领考察团,到美国考察了其煤炭企业在生产经营、财务管理和会计核算等方面的情况。针对我国煤炭企业实际,写出了几篇“联想”,从本
大骨节病是一种严重危害人民健康的地方病.也是一种原因未明的地方性、慢性、畸形骨关节病.我们从1989年至2000年对宁强县大骨节病进行了流行病学调查,现报告如下:
期刊
性激素与孕激素补充疗法,可有效缓解围绝经期综合征的症状,提高妇女的生活质量。本文对围绝经期妇女进行小剂量雌激素与孕激素补充治疗,现将治疗结果报告如下:
目的 研究葛根素与急性脑梗死患者甲襞微循环指标之间的关系。方法 分别于入院时对60例脑梗死患者的微循环测定,治疗组应用葛根素治疗1个月后,两组再分别测定上述指标。结果 治
<正> 江南九省一市煤炭经济信息、经营机制研讨会于去年10月在湖南大庸召开。会议对江南各省的煤炭经济信息进行了广泛地交流,对如何完善总承包和改革煤矿经营机制等问题,进
滴水湖位于上海市临港新城,是国内最大的人工湖,也是港城水系的核心。滴水湖在塑造城市景观生态,优化地区小气候环境起着相当重要的作用,它的水质好坏直接关系到港城未来城市