论文部分内容阅读
随着互联网的发展以及大数据时代的到来,信息爆炸所带来的信息过载的问题也越发明显。推荐系统作为解决信息过载问题的一个有效解决方案,能够有效地为用户个性化地推荐其感兴趣的产品与信息,其在过去数十年中也逐渐成为一个重要的研究热点并被广泛地应用到工业领域。 论文主要研究推荐系统在机票个性化推荐问题中的应用。与传统的推荐系统的推荐对象,如电影、书籍等具有相对固定属性的静态商品不同,机票是属于易受时间影响的,且价格敏感的动态商品。同一张机票在距离起飞的不同时间有着较大的价格波动,而不同的机票价格波动将直接影响用户的购买行为。 文中通过研究和分析用户的历史机票订单数据特征,提出了一种基于用户偏好模型的机票个性化推荐算法,该方法类似于基于内容推荐的KNN的方法,并且引入了信息熵的概念,用来计算用户在不同航线中各个机票特征上的个性化的偏好权重。此外,针对用户在非活跃航线上数据稀疏的问题,还提出了基于航线的协同过滤的算法,用来帮助用户进行跨航线的偏好学习。 此外,文中还提出了一种基于选择模型的机票个性化推荐算法。通过对用户在机票历史订单的成对选择分析,来建立用户选择机票时的效用目标函数及其优化问题。同时,还针对机票动态商品属性,提出了一种结合回归隐语义模型的效用函数模型,其能够很好地结合航班的固定信息和机票本身的动态属性特征,通过隐式空间特征更精准地刻画用户对机票的偏好。 最后,论文还结合了大数据技术,提出了一个面向大数据的机票个性化推荐系统设计框架,包含了数据层,应用层,以及包含了一个离线计算单元和一个在线计算单元的推荐逻辑层。同时,还对文中提出的两种机票个性化推荐算法进行了基于Spark并行计算框架的并行化设计与实现。