论文部分内容阅读
现今互联网的发展日新月异,网络中的数据量呈指数态势增加,随着数据的增加,数字电视和通信技术也得到了迅猛发展,电视节目数量与日俱增,这就导致用户在众多的电视节目中难以找到自己感兴趣的节目,这种情况在一定程度上会影响用户的收视体验与电视节目的收视率。因此,电视节目个性化推荐已成为了越来越多的用户和电视供应商的共同需求。首先,本文分析了现今电视节目个性化推荐中的国内外研究现状与面临的挑战,又介绍了电视节目个性化推荐中的核心——用户偏好模型的研究现状。在此基础上分析了现今主要的推荐系统模型以及聚类模型,并对两种模型的各种衍生模型进行了优缺点总结,这些研究为后面的电视节目个性化推荐算法的改进与设计打下了坚实的基础。然后,本文对用户机顶盒中数据进行了预处理,清洗掉数据中的异常值数据等,并进了统计分析,为后续进一步研究打下基础。接着本文构建了隐式评分矩阵,在之前学者进行的基于用户观看时长的隐式评分的基础上,本文加入了用户收视频率这一重要影响因素,构建了基于收视时长与收视频率结合的隐式评分矩阵,这个矩阵可以进一步提高构建算法的可解释性,并且为下一步推荐算法的设计与分析提供了坚实的数据保障基础。接着,由于用户评分矩阵往往是稀疏的,对于稀疏矩阵进行个性化推荐效果会大打折扣,因此要首先对用户进行类别特征的识别。使用聚类算法对用户进行聚类,然后对不同类别的用户内部进行个性化推荐,可以提高算法准确度。在对用户进行聚类时,针对kmeans++算法中用户距离测量不准确的缺点,本文使用余弦相似度的方法代替原有的欧式距离,更好地对用户相似度进行测量。实例结果表明,改进的kmeans++算法在簇内距离和簇间距离两个测试指标上具有较好的表现。最后,本文采用基于用户评分特征优化的KNN协同过滤算法,该算法目的就是为用户进行个性化推荐。传统KNN协同过滤算法在计算用户相似度时由于只考虑用户的共同评分特征而忽略了用户的不同评分特征,这个评价相似度的方法是不合理的。所以本文采用了基于用户共同特征和不同特征结合的用户相似度计算方法,再将这个方法替代KNN协同过滤算法中传统的相似度计算方法。最后通过实例显示,基于用户评分特征优化的KNN协同过滤算法具有较高的推荐准确性,在MAE、RMSE两个指标上表现良好。本文根据实际家庭电视用户的收视点播数据,对家庭用户进行个性化推荐算法研究,具有巨大的现实意义,也可以为后面家庭用户电视节目个性化推荐系统的研究提供参考。