论文部分内容阅读
协同过滤推荐技术是电子商务推荐系统中最为成熟也是目前最为成功的一种技术,但其受稀疏性、冷启动、扩展性等问题困扰,阻碍了其推荐质量与推荐效率的进一步发展。本文从电子商务协同过滤推荐质量与推荐效率目前遇到的问题出发,从保证基础评价数据的完整性,推荐方法的准确性,计算复杂度的适宜性三个角度去分析电子商务协同过滤推荐系统,指出协同过滤推荐系统瓶颈的产生原因,并提出了改进机制。目前主流的推荐系统多依据用户对项目的直接评分或评价发现用户的购物偏好,在此基础上应用某种推荐算法向用户实施推荐。因部分用户不愿意对项目进行评价从而造成了评价数据的缺失,导致了协同过滤推荐的稀疏性问题。针对该问题,本文提出基于用户的稀疏评价数据应用SOM神经网络对具有相似购物偏好的用户进行聚类,依据同一聚类簇内用户购物偏好的相似性,进一步应用RBFN(径向基函数神经网络)进行平滑预测处理以获得用户对未评价项目评价值。神经网络聚类与预测有效的消除了基础评价数据的稀疏性问题,降低了基础评价数据的不完整性给推荐系统带来的影响。协同过滤受冷启动问题影响,对新注册用户和新上架项目无能为力,针对新用户注册问题,本文提出在基于Vague集理论生成的“产品分类树”空间上实施关联规则挖掘,并依据关联规则实施推荐。关联规则的挖掘与推荐有效的解决了冷启动问题,作为协同过滤算法的必要补充保证了推荐方法的准确性。同时本文在传统基于用户的协同过滤推荐的基础上提出分别对最相似用户与最不相似用户分别聚类,并以两类用户聚类簇偏好产品的差值作为最终推荐以提高推荐精度。针对系统计算复杂导致的扩展性问题,本文提出复杂度的降低应从数据维度降低和计算方法优化两个角度综合考虑。提出一种基于Vague集的“产品分类”方法,对产品特征进行Vague值的提取与表示,并通过Vague值相似性计算公式计算项目之间的相似性,依据项目之间的相似性对项目进行分类,并生成“产品分类树”,该方法能够更准确的表示项目之间相似的精确程度,使相似项目聚类更加准确。在“产品分类树”基础上依据用户兴趣预设“种子类”,在“种子类”内进行计算和推荐。项目的预分类有效的降低了需计算的数据维度,从而有效降低了计算复杂度。在此基础上结合“离线计算”和“在线推荐”进行计算方法优化,即将数据的预处理,相似性计算,聚类计算等前期处理放在离线阶段,充分发挥服务器的性能,在线阶段只实施计算结果的推荐,从而保证了系统的扩展性。