论文部分内容阅读
随着互联网的飞速发展,各式各样的信息充斥着互联网,在线的数据量几乎是以指数级增长,从存量如此巨大并且正在高速增长的数据中获取到用户最需要的那一小部分信息是非常困难的,这就产生了“信息过载”的问题。互联网中的信息中,文字形式的信息最常见,其它形式的信息可以用文字来表示,例如电影和图片等信息,在不浏览所有资源的情况下,可以通过查询这些文字信息来找到目标信息。搜索引擎是一种用于检索信息的工具,当用户把查询内容提交到搜索引擎后,经过检索后把相关内容返回给用户。不同的搜索引擎的搜索效果是有优劣的区别的,通过对用户行为的分析,可以了解到用户的搜索习惯,实现更符合用户需求的搜索引擎。从信息获取的角度来看,用户可以被动获取信息,即系统学习到用户的喜好后主动给用户提供信息,推荐系统可以实现这种需求。首先需要让推荐系统了解到用户的历史行为,经过多个步骤为用户找到其历史行为相近的用户或是与其喜欢的项目相似的项目推荐给用户。基于上述内容,本文完成了以下研究和工作:(1)研究在解决信息过载问题使用的搜索引擎与推荐系统,首先从相关的理论与技术出发,主要内容有:搜索引擎与推荐系统的联系以及它们之间的差异,搜索引擎的基本结构,中文分词技术,全文索引技术,Solr企业级搜索引擎应用,常见的推荐系统技术,推荐系统的评价方法等。(2)基于用户搜索日志、访问日志与市场调研,对移动音乐应用的搜索引擎的功能需求进行了分析。随后基于Solr企业级搜索引擎应用实现了搜索引擎,通过Web应用的形式模拟移动音乐应用的使用。(3)基于用户评分、操作的行为数据,考虑活跃用户和热门项目在协同过滤算法中的影响,对协同过滤算法的不同阶段分别进行考虑,旨在改善协同过滤算法中的马太效应及流行偏置现象。(4)基于用户在音乐应用中对音乐的行为日志的分析,提出一种应用于音乐推荐的基于组合策略的混合推荐。针对不同用户衡量其兴趣偏好,以此采用不同的推荐策略形成推荐结果,达到提高音乐推荐结果的准确性和个性化目标。