论文部分内容阅读
近年来,电子商务以方便信息沟通、收付方式灵活便捷等优点,促进社会信息化发展。但是,随着互联网的发展,很多用户深受“信息过载”的困扰,影响购物体验。于是,能够帮助消费者从海量数据中挖掘出其感兴趣的商品的推荐系统应运而生。推荐系统通过分析消费者的个人特征和行为特征,确定用户兴趣,进而向用户进行推荐。对经营者而言,能够提高交易量,达到精准营销的目的;对消费者而言,能够节约时间,快速找到其有意愿购买的商品。农产品电商是整个电商平台中尤为重要的一部分,农产品推荐系统具有增加农民收入、提高第一产业竞争力、促进农业信息化发展等重大意义,然而,现阶段关于农产品电子商务个性化推荐系统的研究较少。本文的研究目标是设计一种面向农产品的推荐算法,该算法以协同过滤推荐算法为基础,以快速推荐,效果良好为目标。本文的研究旨在抛砖引玉,以激发更多面向农产品的推荐算法的进一步、更深入的研究,本文主要工作及创新点如下:(1)选取面向农产品的推荐算法的基础算法。对农产品电子交易区别于其他商品交易的特点进行梳理,同时对协同过滤推荐算法进行总结和分类,并指出算法面临的问题。综合农产品线上交易的特点和各种协同过滤算法的特点,选取基于项目的协同过滤算法作为本文研究的面向农产品的推荐算法的基础算法。(2)针对冷启动问题,对算法做出改进。传统的协同过滤算法在冷启动情况下,推荐效果不佳,针对这一问题,本文提出IPSS项目相似性度量方法。此方法有两个主要部分:评分相似度和结构相似度,其中,评分相似度主要考虑两个项目评分之间的评分差、项目评分与评分中值之差,以及项目评分与其他评分平均值之差;结构相似度部分定义了共同评分项目占所有项目比重并惩罚活跃用户的逆项目频率(Inverse Item Frequence,IIF)系数。(3)针对可扩展性问题,对算法做出改进。传统的协同过滤推荐算法在海量数据情况下,会受到可扩展性问题的影响,针对这一问题,本文提出融合项目谱聚类的协同过滤算法。算法分为离线和在线两个步骤:离线时对项目聚类;在线时,首先确定目标项目从属的类别,然后在类中搜索近邻,最后求未评分项目的预测评分并据此为目标用户产生推荐。(4)对算法在真实数据上进行实验。简要介绍推荐引擎整体框架,并根据现有数据和算法使用MATLAB2009b在Movie Lens 100k和Grecs两个数据集对优化算法进行实验。首先需要按提示输入需要为其进行推荐的目标用户的编号,在手动输入编号后,程序会自动计算未评分项目的预测评分并根据计算结果产生推荐项目列表,展示给用户。本文提出的面向农产品的协同过滤推荐算法(记作SC-ICF)能够有效实现农产品推荐功能,此外,在冷启动、大规模数据集情况下,推荐效果优于传统算法。