论文部分内容阅读
随着互联网技术的飞速发展,面对海量资讯,愈发成熟的推荐算法为人们提供了一份便利。在智能电视产业的快速发展过程中,对电视节目进行个性化推荐已经成为用户和电视产业运营商的共同需求。本文以智能电视产业为背景,主要研究基于用户特征下的电视节目推荐算法,以提高推荐算法准确度为目标,在电视用户收视记录数据和基于近邻的用户协同过滤推荐算法的基础上开展研究,改进算法。同时根据实例数据对本文改进的推荐算法进行实验,来验证该算法推荐准确度。首先,由于电视平台运营商仅能获取用户机顶盒中的收视数据,因此需要对该数据进行预处理。将异常数据、冗余信息等进行清洗处理,并根据数据信息进行简要的统计分析,对用户收视特征进行简要概括。然后,根据已有的基于观看时长的隐式评分模型,在此基础上结合观看频率、收视时长总占比等因素,构建混合隐式评分模型,将蕴含用户偏好的历史操作,转化为电视节目评分,为后续推荐算法做铺垫。其次,针对智能电视平台节目更新速度远超用户增速的特点,在推荐时选用基于近邻的用户协同过滤算法。评分数据往往存在稀疏性和可扩展性问题,本文在进行近邻推荐之前,根据相似度矩阵对用户进行聚类,将相似用户归为一类,目标用户求解时仅需在所属类中进行基于近邻的用户协同过滤算法。传统K-means聚类基于欧氏距离计算其聚类结果存在局部最优解的缺点,本文采用基于Pearson相似度计算的流形学习谱聚类进行聚类划分,且根据用户评分特征对相似度计算公式进行优化。实验结果显示,基于相似度的流形聚类方法比K-means聚类拥有更好的准确性。同时,基于相似度优化和流形学习的改进用户协同过滤算法通过聚类和相似度计算的改进,缓解了数据的稀疏性,相较传统的近邻协同过滤算法拥有较好的推荐准确度。最后,传统协同过滤算法中对项目的预测评分采用加权预测评分计算公式,在电视节目推荐时,该计算公式仅根据隐式评分数据,一定程度上忽略了用户和电视节目的特征,会使预测评分产生误差最终影响推荐准确度。因此,本文引入改进的Slope One算法,综合考虑用户隐式评分蕴含的用户收视特征和项目属性相似度,同时将改进Slope One算法和传统的加权预测评分计算方法相结合,形成混合预测评分方法。在第四章的改进推荐算法的基础上,将算法中预测评分部分进行上述混合预测评分,最终形成一种基于用户特征融合多种算法的电视节目混合推荐算法。实验结果显示,对预测评分的混合改进使该混合推荐算法相较上一章改进算法,在MAE、RMSE两个评价指标上有更好的表现,即拥有更优的推荐准确度。本文根据智能电视用户的电视节目收视数据,研究得到了一种基于用户特征的电视节目混合推荐算法,为电视节目个性化推荐提供了一种新的解决方法。