论文部分内容阅读
随着Internet的普及和应用,电子商务以其成本低廉、便捷、快速、不受时空限制等优点风靡全球。电子商务为用户提供越来越多选择的同时,其结构也变得更加复杂和庞大。一方面,用户面对大量的商品,要找到自己需要的商品变得越来越困难;另一方面,商家也在大量的电子数据中失去了与消费者的联系。个性化的电子商务推荐系统根据用户行为特征为用户提供一对一的服务,帮助用户找到所需商品,从而顺利完成购买过程。商家通过推荐系统能够提高电子商务系统销售,保持与客户的联系,提高用户忠诚度和满意度。
协同过滤是目前最成功的个性化推荐技术之一,它的基本思想是利用用户访问行为的相似性来互相推荐用户可能感兴趣的资源。然而,目前的大多数协同过滤系统面临着数据稀疏性、冷启动和可扩展性三个问题的困扰。其中数据稀疏性问题严重影响了推荐系统的推荐质量。论文针对此问题进行了深入研究,提出了基于粗集的补值算法(IFRS:Improved Fill Miss Values Algorithm Based On Rough Set)和基于相同评分矩阵的补值算法(CMFM:Fill Miss Values Algorithm Based OnCo-rating Matrix)用于解决稀疏性问题。
IFRS算法是一种基于粗集的补值算法,论文根据协同过滤数据的特点设置了阈值ζ用于刷选相似度更高的用户作为补值参考,同时根据实验中的表现情况选择了使用出现频率最高值填补剩余空缺评分。实验结果显示改进后的算法性能明显提升。
CMFM算法是论文提出的一个新方法。该方法中提出了一种新的相似性度量方法,并提出相同评分矩阵的概念来支持该相似性方法。算法通过动态维护的相同评分矩阵,在循环多次的补值过程中始终选择当前相同评分数最多的对象作为补值参考对象,这种做法有效避免了稀疏性问题对补值算法本身的影响。为提高算法效率,论文提出了一个快速动态维护相同评分矩阵的方法,确保了算法的可行性。实验结果证明,CMFM算法不但具有较快的补值速度,而且推荐精度较高。