论文部分内容阅读
飞速发展的计算机、互联网和web技术改变了人们的生活,人们在虚拟社区中结交好友、在新闻网站中浏览新闻、在视频网站中观看电影、在虚拟图书馆中查阅书籍、在电商平台中购买物品。但是,人们在享受多彩生活的同时也感受到了信息膨胀带来的烦恼,即人们无法在海量数据中快速有效地找到最相关的信息。电影、书籍、网页等信息的数据量动辄以千万级,这些数据信息的增长速度已经远远超过了人类的自然处理能力。在这种大数据的背景下,用户获取所需信息的代价越来越大,仅仅依靠传统人力的方式已经无法评价和选择这些物品。在这种情况下,有效过滤海量信息的最有吸引力的方法就是个性化推荐技术。它利用用户个人信息,例如用户活动的历史记录,发现用户喜好,然后根据用户喜好进行推荐,例如Amazon.com使用用户的购买历史记录向用户推荐书籍,AdaptiveInfo.com使用用户的阅读历史向用户推荐新闻,还有TiVo数字视频系统根据用户的观看模式和评分记录向用户推荐电视节目。研究者们提出了多样的推荐算法,其中,基于链路预测的协作推荐算法受到了广泛关注。本文从单一节点网络上的链路预测研究入手,研究二部图网络上的链路预测,发现物品之间的相似性,结合协作技术完成推荐。论文主要工作和创新点如下:1、考虑无权网络上的弱关系特性,提出基于局部路径相似性的改进链路预测算法。传统相似性算法,尤其是基于半局部路径相似性AA (Adamic Adar)和RA(Resource Allocation)算法,忽略了邻居关系强弱程度对于节点相似性的影响,导致算法预测性能的局限性。因此本文从端点之间弱关系角度出发,提出了基于局部路径相似性的改进链路预测算法OAA (Optimized AA)和ORA (Optimized RA)。实验结果表明突出弱关系的改进算法有效提升了算法的准确性和适应性。2、发现路径所具有的异构性,并提出SP (Significant Path)算法。研究发现,在半局部路径相似性链路预测中,不同结构的路径传递相似性的能力不同,小度节点构成的路径能在端点之间传递更多的相似性,而且较长路径能提供更多相似性传递通道。因此本文根据路径异构性,提出SP (Significant Path)算法,给不同路径赋予不同权重,增强链路预测准确性。3、提出考虑端点有效影响力的有效路径算法。研究发现,传统算法忽略了端点的无贡献连边,夸大了端点影响力,错误地增强了端点间的相似性,削弱了链路预测的准确性。本文提出有效路径EP(Effective Path)算法,剔除端点无贡献关系,提取有效影响力,同时结合路径差异性,突出小度节点构成的路径。实验结果表明,相比于传统算法,EP算法明显提高了链路预测的准确性。4、考虑未购买物品到已购买物品的反向相似性,提出修正相似性推荐算法。研究发现,通过研究网络资源扩散和二部图拓扑特性,可以利用链路预测算法实现相似性推荐,但是,由于网络数据的稀疏性和不对称性,物品的相似性估计会出现偏差。本文考虑未购买物品到已购买物品的反向相似性,修正了单向相似性估计,克服了数据的不对称性,称为修正相似性CSI (Corrected Similarity Inference)推荐算法。实验结果表明,相比于传统相似性推荐算法,CSI可以明显提高推荐的准确性、多样性和新奇性。5、提出一致性推荐算法。研究表明,传统相似性推荐算法的推荐依据是购买时间上的因果关系,但是在大部分时间用户购买物品的先后顺序并不存在因果关系。事实上,用户购买物品的本质在于对两个物品喜好的一致性,因此本文提出一致性推荐算法CBI(Consistence-based Inference)和非平衡一致性推荐算法UCBI (Unbalanced CBI)。实验表明一致性推荐算法能较好地改进算法的准确性、多样性和新奇性。