论文部分内容阅读
面对互联网时代中信息过载所带来的各种问题和挑战,人类正不断研究和发展不同的新技术,其中个性化信息服务技术独占优势,主要包括搜索引擎和推荐系统。虽然搜索引擎能够基于用户所提供的明确的需求信息,做出针对性的搜索服务,但是由于内部机制的限制,用户参与度高,服务内容局限。而推荐系统的产生能够弥补搜索引擎所存在的不足,通过分析用户历史行为数据,发现用户的兴趣偏好,从而主动生成满足用户需求的信息内容。到目前为止,推荐系统不仅成为了电子商务发展过程中必不可少的部分,而且在其他领域也被广泛应用。推荐系统的核心在于个性化推荐方法,各种不同的推荐技术正逐步受到国内外业界人士的广泛研究与实践,其中协同过滤推荐技术最受青睐。本文在对国内外研究现状分析的基础上,通过探讨现有的个性化推荐的相关理论和技术,主要针对协同过滤推荐技术进行了更深一步的研究。本文首先针对基于内存的协同推荐方法,从数据稀疏性以及用户偏见性的角度考虑,提出一种优化的协同过滤算法。通过建立用户偏好主题向量,间接获取用户之间的相似性,以此克服数据稀疏性对用户相似度计算准确性的影响。同时基于对用户偏见性的考虑,引入贝叶斯重排序算法,建立项目的信任子群,获取用户对信任子群的局部偏见,最后通过加权相似用户对目标项目的评分最终产生推荐,并通过相关实验验证了此方法的可行性。其次,基于用户隐式评分数据针对基于模型的协同推荐技术,从用户兴趣的潜在性以及高时效性业务场景下用户兴趣的不稳定性和时间迁移性的角度出发,提出一种基于用户潜在时效偏好的推荐方法。通过深入分析用户的历史行为与用户潜在兴趣的关系,采用了基于概率主题模型的用户兴趣挖掘方法。同时,结合隐马尔科夫模型对用户兴趣进行实时捕获,发现用户的兴趣迁移序列,最后通过多次实验验证了所提出方法在高时效性业务场景中对于推荐性能的改善。最后,针对基于模型的协同推荐方法在用户显式评分数据集上存在的概念漂移问题进行了扩展,对推荐系统中用户兴趣的动态性和多样性,以及其学习过程对潜在情景变化的敏感性进行进一步研究,综合时间因子对用户潜在兴趣的全局影响和局部作用,提出一种基于概念漂移的兴趣二阶段学习方法。分析了时间因素与概念漂移问题的紧密关系,通过在用户-项目的评分数据集上对用户兴趣的两个阶段的模型学习,证明了此方法在解决概念漂移问题上的有效性,以及对提高系统的整体推荐质量的改进。