论文部分内容阅读
随着移动互联网的蓬勃发展,信息的指数级增长加剧了信息迷航现象的发生。如何在有限的展示页面,提供给用户最感兴趣的信息和服务,是当下商业应用亟需解决的核心问题。推荐系统(推荐算法)作为解决信息迷航的有效工具,目前已经被广泛应用于各大商业网站并取得巨大的商业价值,比如Alibaba淘宝的商品推荐、Google的新闻推荐、Netflix的电影推荐以及Coursera的课程推荐等。传统协同过滤推荐算法作为推荐系统应用最广泛的技术之一,虽然已经取得较大的成功,但仍然存在一些问题:当新数据加入时,传统机器学习批量化的训练方式不能及时有效的更新算法;对于流式数据,由于传统协同过滤推荐算法需要重新训练,导致其可扩展性较差。因此,在线协同过滤推荐算法应运而生。在线协同过滤推荐算法通过改进传统协同过滤推荐算法的优化方式,使得算法能够在每个时间步更新参数,从而克服批量化训练流式数据带来的训练成本高问题。基于以上认识,本文从传统机器学习、欧氏空间深度学习以及非欧空间(双曲空间)深度学习三个角度,提出了三种改进的在线协同过滤推荐算法。论文的主要研究工作概括如下:1)针对在线协同过滤推荐算法中用户偏好及物品流行度随时间动态变化的问题,本文从传统机器学习角度提出了两个改进的在线协同过滤推荐算法,分别为:基于动态规则的在线协同过滤推荐算法(OCF-DR)以及基于动态规则和近邻因子的在线协同过滤推荐算法(OCF-DRNF)。首先,OCF-DR算法引入了用户评分的平均动态变化得分和动态偏置项,并在算法每一轮训练过程中更新用户和物品的权重向量。其次,OCF-DRNF算法是在OCF-DR算法的基础上,引入了近邻用户评分动态变化惩罚项,使算法能追踪近邻用户的偏好变化。实验结果表明,OCF-DRNF算法在低维特征空间的表现优于参与比较的其他算法。同时随着采样数据不断增加,OCF-DR算法和OCF-DRNF算法的收敛效果都优于参与比较的其他算法,尤其是在算法训练起步阶段收敛效果更加显著。2)针对在线协同过滤推荐算法的“冷启动”问题和数据稀疏性问题,本文从欧氏空间深度学习技术角度提出了两个改进的在线协同过滤推荐算法,分别为:基于深度概率矩阵分解的在线协同过滤推荐算法(OCF-DBPMF)和基于限定向量的深度概率矩阵分解的在线协同过滤推荐算法(OCF-DCBPMF)。首先,OCF-DBPMF算法通过引入卷积神经网络提取用户和物品的潜在特征向量,并增加用户偏置项和物品偏置项,以追踪用户评分行为和物品流行度变化。其次,OCF-DCBPMF算法是在OCF-DBPMF算法的特征向量上加入限定的用户和物品向量,以解决算法更新过程中,用户和物品潜在特征向量逐步接近于先验平均向量的问题。实验结果表明,OCF-DBPMF算法和OCF-DCBPMF算法在低维特征空间的表现都优于参与比较的其他算法,尤其是在特征维度小于8时,OCF-DCBPMF算法的表现更好。这也说明改进算法限定用户和物品向量的有效性。3)针对教育应用场景中知识信息的层次性和学生学习数据的实时性特点,本文从非欧空间(双曲空间)深度学习角度提出了两个改进的在线协同过滤推荐算法,分别为:基于双曲深度知识点追踪的在线协同过滤推荐算法(OCF-HDKT)和改进的基于双曲深度知识点追踪的在线协同过滤推荐算法(OCF-HDKT+)。首先,利用双曲门控循环单元(Hyperbolic GRU)搭建了双曲深度知识点追踪算法(HDKT)。其次,考虑到教育场景中学习资源推荐的实时性,在HDKT算法提取的特征向量基础上,结合在线协同过滤推荐算法,构建了 OCF-HDKT算法,使其能嵌入知识数据的潜在层次结构信息,并满足在线教育的实时性要求。最后,在OCF-HDKT算法的基础上,通过引入波动性和不一致性的惩罚项,构建了OCF-HDKT+算法,以解决算法预测的波动性和不一致性问题。实验结果表明,OCF-HDKT算法和OCF-HDKT+算法的整体表现都优于参与比较的其他算法,其中OCF-HDKT+算法在预测的平稳性及一致性方面表现更好。总之,本文针对在线协同过滤推荐算法目前存在的问题和在线教育的应用场景,从传统机器学习、欧氏空间深度学习以及非欧空间(双曲空间)深度学习三个角度,提出了相应的改进算法。大量的比较实验表明,本文提出的算法可有效提高算法的预测能力,对推进相关研究具有一定的指导意义。