基于协同过滤和聚类算法的缓解长尾效应算法研究

被引量 : 0次 | 上传用户:wyp154
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推荐系统作为处理信息爆炸的一种重要技术手段,可以帮助用户于繁杂的信息中,快速获取所需信息。结合当下5G技术快速实施、边云协同技术迅速发展,未来用户产生的数据量快速增加,随之而来的问题是用户面临的数据选择越来越多,然而用户的时间和精力有限,无法从繁杂的数据中获取所需信息。推荐系统虽然已经提出多年,但仍面临冷启动、推荐准确率低、评价指标不完善等问题。本文基于协同过滤算法,从推荐系统的数据分析分类入手,借鉴了经济学中“帕累托法则”,对数据进行聚类分析;在设计算法时,基于协同过滤算法,同时考虑了数据的时序性,提出了时间敏感因子,以实现推荐结果条件反射级动态调整,同时情景感知系数,智能感知推荐情景,根据推荐情景模块实时感知当前情景,做到实时个性化推荐;对现有的评价指标进行可行性和有效性论证,对推荐结果进行分析表明,提高了推荐的准确率,提高了用户的服务体验。本文主要研究成果如下:(1)实现了数据预处理可视化。对于推荐数据,实现了数据预处理可视化,主要进行数据的清洗和分析,利用箱体图、拉格朗日插值法、主成分分析法等方式对数据进行脏数据的清洗,并对数据集的长尾效应进行分析和可视化,以便对数据有一个整体的把握和了解。(2)设计了协同过滤模型。对于计算物品相似度阶段,设计协同过滤模型,其中针对头部和尾部数据分别进行处理,头部数据考虑到时间敏感、物品特征稳定性等因素,利用协同过滤模型进行分析处理,计算物品相似度,生成推荐列表候选集,对于尾部数据则利用K-Means算法进行聚类处理,以便更好地进行协同过滤处理,最后生成推荐列表候选集。(3)设计了候选列表推荐模型。对于生成的推荐列表候选集,采用图论中的二分图模型表示,然后定义交替路经和增广路径,对二分图进行探索推荐,以缓解物品的长尾效应。
其他文献
随着我国中产规模扩大,大众生活品质提升,国民对乳品的需求与日俱增,乳制品行业呈现出蓬勃发展的态势。经过多年竞争,该行业集中度较高,伊利、蒙牛两家企业基本形成了双寡头竞争的局面。伊利集团多年来稳居前列,是最具研究价值的乳品企业之一。本文以伊利集团为例,通过相关数据和企业年报分析伊利集团的经营成果,并结合公司整体发展情况进行全面剖析,从提高管理水平、重视人才培育、产品差异化、绿色低碳发展四个方面,为伊
研究目的:黑色素瘤是由于神经嵴的异常黑色素细胞过度增殖所引起的恶性肿瘤,其具有转移性强、生长速度快、致死率高等特点,已成为重要的公共卫生问题。当前用于治疗黑色素瘤的方法主要有:外科手术、放化疗、免疫疗法及靶向治疗等。而近年来研究显示免疫疗法的治疗效果与其他治疗方式相比更持久,且采用免疫疗法的患者其预后效果更加明显,现已得到研究人员的广泛关注。免疫疗法主要是通过提高机体的免疫能力,进而加强免疫细胞识
学校推行壮汉双语教学以来,教育教学质量不尽如人意,存在壮语文课程教学缺乏、壮语文质量监测过于单一、评价方法机械单调等问题。究其原因,在于对壮汉双语教育教学质量监测与评价的单一性。只有对壮汉双语教育教学质量实施多元监测与评价,才能激发壮汉双语学校师生的主动性,有效提高学校壮汉双语教育教学质量。具体来说,应科学构建壮汉双语教育教学质量监测与评价机制,开发校本课程资源丰富校园文化生活,组织多元监测与评价
综述了土壤重金属污染的危害,牧草作为修复植物的优势,以及主要牧草对重金属污染土壤的修复效果。提出了进一步筛选重金属富集能力强的牧草品种,寻找各种改良措施提高牧草的修复能力将是今后的研究热点。同时,人们应该更加关注植物修复的后期处理,尤其是解决从植物体内回收重金属的生产工艺问题。
习近平总书记在纪念五四运动一百周年的重要讲话中指出,“新时代中国青年要担当时代责任”,党的十九届六中全会提出要“培养造就大批堪当时代重任的接班人”。大学生作为青年中的先进群体,生逢盛世,更应与新时代同心同向,勇担重任,应以初生牛犊不怕虎、越是艰险越向前的锐气,踔厉奋发,自觉承担起中华民族伟大复兴的重任。根据当前时代发展需要与大学生成长成才的现实需要,将培育新时代大学生担当精神作为选题具有重要的理论
<正>今年来,石狮市政协积极探索新时代人民政协履职新路径,扎实推进政协委员工作室(联系点)规范化创建管理,开展富有特色的基层协商活动,促进政协履职平台更宽、工作触角更深、社会联系更紧。搭建履职尽责新平台市政协积极搭建富有时代特征、政协特点、石狮特色的履职平台,统筹建好用好各具特色的委员工作室(联系点),充分发挥委员在围绕中心、服务大局、关注民生、凝聚人心等方面的积极作用。
期刊
随着互联网业务的飞速发展,用户投诉网络质量问题日益增多。为直观量化宽带互联网网络质量,提出一种基于长尾效应的互联网网络质量评分模型,该模型自适应增大关键质差指标权重,相比较传统模型能够更加精准地显示网络质量及波动,测试结果表明,该方法可以有效地评价网络的质量状况和用户感知情况,并为专业技术人员优化网络提供可靠依据。