论文部分内容阅读
在处于互联网信息时代的今天,数据量日益庞大,信息过载问题逐渐突出。音乐推荐系统的使命就是从繁芜的音乐资源中选择合适的音乐推荐给用户,帮助用户更便捷地找到自己感兴趣的音乐。为了获得更好的推荐,研究者们逐渐将关注点转向研究如时间、地点和情绪等上下文信息对音乐推荐系统的影响。但是,在时间因素的应用研究中,大多是考虑用户听歌兴趣随长期时间的转移,并没有考虑到用户在短时间内兴趣偏好的循环变化。事实上,在短时间(如:一天)内用户的听歌偏好也是在随时间发生变化的,相较于比较明显的长期时间引起的兴趣转移,这种短期时间的偏好循环变化通常是更为隐蔽的。因此,本文致力于挖掘用户听歌行为的时间特征,并将其应用于推荐之中,以获得更好的推荐精度。本文致力于研究用户听歌规律,即用户会在什么时候听什么样的歌曲,并且对用户在不同时刻的听歌需求进行判断,从而生成细粒度的个性化推荐。由此,本文提出了一种新的基于用户行为时间特征的音乐推荐算法模型(User-Behavior Time-aware Music Recommendation,UBTMR)产生满足用户在不同时刻听歌需求的音乐推荐。本文首先对推荐系统及音乐推荐系统进行了简要介绍,并且根据当前音乐推荐系统所存在的几大问题展开工作:1)针对于在音乐推荐系统中,用户随短期时间变化的听歌偏好变化规律鲜有研究和充分利用这一问题。本文提出了考虑用户细粒度时间内的听歌规律的推荐策略,挖掘出用户在短时间内(如:一天内)的听歌循环规律,并将其应用于推荐中;2)在线音乐系统中,用户的评分记录通常是远远少于用户的听歌记录,而大多推荐系统都是根据用户评分记录来进行推荐的,这使得系统面临数据稀疏性挑战。因此,本文利用用户听歌记录作为判断用户歌曲喜好程度的依据,并根据听歌记录进行运算和推荐;3)针对于在不同时间段,音乐彼此之间的推荐强度不同这一问题,本文提出非对称性推荐度的概念,替代推荐运算中常用的对称性相似度。并将现有的音乐推荐系统在运算过程中缺乏综合考虑的用户活跃度和歌曲流行度等特征考虑在内,以增强推荐精度;4)在运算过程中,经典协同过滤算法对于每首歌曲都查找相同个数的最近邻居,但是并没有考虑这是否是最合适的最近邻范围。而本文充分考虑歌曲的流行度对歌曲需要查找的最近邻个数的影响,使用k-means聚类将相似的歌曲聚在一起用以寻找最近邻。实验表明,将用户长短期听歌偏好考虑在内可以使用户的听歌规律得以更好地挖掘,从而能进行更为精细且准确的音乐推荐。同时,将用户活跃度和歌曲流行度考虑在内所得的推荐结果的Recall、Precision和F1值都有所提升。而最后的非均匀切片实验结果也显示该方法较均匀时间片切分更为符合实际需要。