结合用户行为的电视产品推荐系统设计与实现

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户:chenchaozhi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了帮助网络运营商改善用户个性化服务推荐,结合某广电网络运营公司的提供的用户观看行为记录,本文从多个维度构建收视行为特征向量设计并实现了基于线性加权的混合模型推荐系统,同时在真实的数据集上对实现的系统的性能进行测试分析,具体研究内容如下:1.从多个角度对用户行为数据进行统计分析,发现用户的活跃度和电视产品的流行度都存在长尾分布;其次分析了用户活跃度和电视产品流行度之间的关系,发现高活跃的用户喜欢点播冷门电视产品,而低活跃度的用户喜欢点击热门电视产品的特点,进而深入分析了计算用户偏好性实现用户物品个性化推荐存在的关键问题以及问题之间的层次关系,在此基础之上,设计基于用户行为的推荐系统框架。2.为了说明不同的用户收视行为反应用户收视偏好的程度是不同的,对用户的收视行为进行了简单的分析;其次,从三个不同的维度,分析了用户的行为偏好性,构建了基于收视行为的特征向量、基于点播行为特征向量(用户_二级目录特征和用户_关键词特征)和用户收视的时间特征向量。为了降低了热门词汇在用户关键词列表中的权重,利用TF-IDF的基本思想构建用户_关键词特征,从而改善对用户的个性化描述。3.由于数据集中存在所谓的“新用户”和“新物品”现象,对经典的基于用户和基于物品的协同过滤算法而言,是一个冷启动问题。经典的推荐算法在不同的场景表现出的性能有所不同,为了提高算法的准确度和健壮性,提出了基于加权融合的混合推荐算法模型;由于基于协同过滤的方法和基于用户主题兴趣相似度的推荐模型的一个核心步骤为相似计算,因此需要分析不同相似度计算方法;然后,设计并实现了5种不同的推荐算法;最后通过线性融合的方法将5种算法进行融合形成加权混合推荐模型,以提高算法推荐的准确度。4.为了全面评估系统的性能以及避免模型的过拟合线性,首先利用十折交叉验证法对数据集进行了划分,其次,从准确率、召回率、覆盖率和流行度四个评估指标测试各个子模型的在用户收视行为数据集上的性能,并且各子模型自带的参数;最后基于线性回归的方法给各个子模型赋予特定的权值,并比较模型和子模型测试数据集上表现性能,发现基于加权混合后的模型在准确率、召回率和覆盖率方面优于子推荐模型。
其他文献
上合组织青年交流营活动系落实习近平主席倡议的青年交流品牌项目,并已纳入《中方担任2017-2018年上合组织轮值主席国工作计划》。2015年7月,习近平主席在上合组织乌法峰会上宣布,为加强青年交往,中方将在上合组织国家青年领导人访华研修计划的基础上,自2016年起连续5年在华举办上合组织青年交流营。上合组织成员国和观察员国的人口几乎占全球人口的一半,随着上合组织不断扩大,国际影响力不断提升,成为促
对黄土台塬乾县试区旱地小麦不同降水年型的土壤水分特征及水分利用效率长期研究结果表明,该区按降水量多少分为丰水、平水和干旱3种降水年型,干旱少雨是这一研究时段的主要
针对黄土台原自然降水特点及农业生产实际情况,在已有研究基础上,以具有显著保水性能的地膜覆盖技术为中心,设计出旱地小麦自然降水高效利用新模式.研究表明,夏闲期采用地膜
近年来,对复杂网络结构与网络功能之间相互关系与影响的研究受到越来越多的关注,这是由于通信、电力、生物、社会和经济等复杂系统都可以用复杂网络加以描述。其中节点代表个
目的 :探讨桡骨远端B型骨折腕关节镜直视下复位后予Herbert螺钉固定治疗的临床疗效。方法:2013年6月至2015年7月,采用腕关节镜直视下手法复位及撬拨复位Herbert螺钉固定同时修
电站在运行期间积累了海量过程数据,它们是对机组运行状况最直接的反应。数据驱动建模方法提供了一种有效的途径,帮助人们从这些海量运行数据中提取出有用的信息,掌握机组运
随着社会的不断发展,学校的教学也在不断的发生着改变。在每一个班级中学生之间都会存在较大的学习效率差异。而学困生在学习中所存在的整体学习效率尤为低下,已经成为现如今
SA作为软件系统的高层抽象及后续开发、测试、维护等阶段工作的依据,其复杂性对系统影响深远.依据CN及SA理论特点,提出了利用CN进行SA复杂性的度量及控制方法.论文首先介绍了
近年来,受经济结构调整、全球经济增速放缓的大环境影响,火力发电厂电力市场日益严峻。机组的利用小时数降低,负荷率不高,1000MW级超超临界机组常出现30%的出力情况,并且长时