论文部分内容阅读
互联网的快速发展带来了信息的爆炸式增长,这反而使用户获得有效信息变得越发困难,导致了“信息过载”(Information Overload)现象的出现。流媒体社交网络也受此影响。虽然个性化的推荐系统能有效的解决这问题,但是现有的推荐算法依然存在不少问题,如稀疏性问题、冷启动问题等。本论文依托“沈阳手机广播系统”这一项目,针对手机广播系统这一应用的特殊性,设计了由数据处理模块和推荐模块组成的数据挖掘组件,最终实现流媒体和社交网络这两部分的推荐功能,即好友推荐和节目推荐。同时,基于系统数据的特征,将推荐模块的推荐算法设计成三个独立的推荐算法的组合,从而完成更好的推荐功能。本论文主要工作如下:1.研究了各类推荐算法,然后根据系统各方面的需求,设计了一种基于项目和用户分别聚类的推荐算法。项目聚类为了解决稀疏性问题,用户聚类是为了降低求解最近邻居的时间消耗。2.针对系统数据的特点,设计了三个推荐算法组合的推荐模块,这三个推荐算法分别是:基于用户好友关系的推荐算法,基于用户评分的推荐算法以及基于用户收听时长的推荐算法。3.针对推荐算法中的问题,提出了相似可信度、用户关注度等概念,并依此改进了相似计算公式,更好的满足系统的需求。本论文根据手机广播系统的需求以及系统数据的特点进行了多项改进,并对改进后的推荐模块进行模拟测试,实验表明,改进后的推荐系统具有更好的推荐效果。