【摘 要】
:
随着网络越来越发达,以及信息技术越来越完善,人们实现了“在家不出门,便知天下事”的信息自由。接踵而来的不再是信息稀缺的问题,而是如何处理超出人们可以人为方便处理的数据量的问题。对于电影行业来说也面临着同样的问题,自从Netflix利用其3000万付费用户的数据制作《纸牌屋》(House of Cards)以来,大数据一直在发挥着重要作用。推荐系统就是解决这一问题的有效方法,可以帮助片方便捷地找到目
论文部分内容阅读
随着网络越来越发达,以及信息技术越来越完善,人们实现了“在家不出门,便知天下事”的信息自由。接踵而来的不再是信息稀缺的问题,而是如何处理超出人们可以人为方便处理的数据量的问题。对于电影行业来说也面临着同样的问题,自从Netflix利用其3000万付费用户的数据制作《纸牌屋》(House of Cards)以来,大数据一直在发挥着重要作用。推荐系统就是解决这一问题的有效方法,可以帮助片方便捷地找到目标群体,也帮助用户减少搜索心仪的影片所花费的时间。基于协同过滤的推荐算法最常被用于电影推荐中,然而,数据量在这个时代的爆炸式增长,对于推荐系统来说既是机遇同样也是挑战。协同过滤推荐算法中存在的问题有两方面,一方面是协同过滤算法中只考虑用户评分矩阵而忽略电影内容的问题,另一方面是冷启动以及用户评分矩阵稀疏性的问题。为了解决这两方面的问题,本文采取基于用户画像与知识图谱融合的电影推荐算法。本文主要包括以下三个方面的内容:(1)为了解决上面所述第一个方面的问题,本文在推荐系统中结合了用户画像,通过利用用户画像的特点和性质将电影内容考虑进去以提升推荐性能。通过分析用户与电影的交互记录,利用用户画像技术准确描述用户信息,采用LDA和TF-IDF文本挖掘算法建立用户建模时的文本主题模型。(2)本文将知识图谱与推荐系统相结合以解决稀疏性评分矩阵的问题。通过建立出电影领域中的知识图谱,可以提取出电影的语义信息,再通过与协同过滤算法的结合,就可以有效地提高推荐性能。在知识图谱与推荐算法结合的过程中,采用的算法是在传统的算法基础上改进的Ripple Net算法,通过使用用户点击记录不断扩大挖掘出用户感兴趣的潜在点。最后将基于用户画像的推荐算法与基于知识图谱的推荐算法推荐出来的影片进行结合,提高推荐算法的精确度。(3)实证研究。为了使本文的优化算法更有说服力,本文在电影数据集Movie Lens上对基于用户的协同过滤算法做了实证研究,之后又引入了IMDB集对混合后的推荐算法进行研究。最后通过召回率、准确率、综合值F1对推荐效果进行评价。通过实证证明本文提出的算法对于推荐系统性能的提升有很好的效果。
其他文献
改革开放以来,我国农村经济快速发展,农业产量连年增收,农民的生活越来越好。然而与此同时,农村的资源环境状况却越来越不容乐观。面临这样的困境,很多国家开始实行农业生态补偿政策。农业生态补偿政策是目前改善农村生态环境质量、协调环境保护与生产发展之间矛盾的重要手段。展开农户生态补偿受偿意愿影响因素的研究,可以为农业生态补偿政策的制定和推行提供依据。本文随机选取成都市温江区101名农户为调研对象,将农户的
在企业的经营管理中,汇率风险已经成为其面对的主要风险之一。“811汇改”拉开了新一轮人民币汇率形成机制改革的帷幕,人民币兑美元汇率从持续升值转为阶段性贬值。人民币汇率波动对中国企业究竟有何影响?企业汇率风险对冲策略有哪些?其效果如何?这些问题对于深入理解人民币汇率波动的影响机制,分析汇率波动对我国进出口和经济发展的影响,完善我国跨国公司的汇率风险管理具有重要意义。在此背景下,本文考察了海尔智家的人
随着大数据时代的到来,通过数据挖掘获取信息已经成为常态,然而我们获取的数据大多数情况下都是含有缺失值的,也就是说数据是不完整的。然而很多统计方法在做数据分析时,都需要完整数据才能研究。数据缺失普遍发生在各个研究领域中,对缺失数据的处理已经不能局限于忽略或者直接删除,数据插补法逐渐活跃起来。本文主要探讨的是多种插补方法对于分类型缺失变量和连续型缺失变量的插补效果。在探究分类缺失变量的插补方法时,首先
AR教学资源呈现的知识立体化、多样化,其交互性也让学习者可以从中理解、探索知识,被越来越多的教师应用于日常教学中。初中地理知识涵盖面广,抽象的知识是学生理解的难点。本研究结合AR教学资源与初中地理教材内容进行教学设计,并在教学中实践,探究AR教学资源和初中地理教学的整合方式与效果。本论文通过文献研究法梳理了AR资源在教育中的研究现状。以建构主义学习理论等为指导,对课程目标、课程内容和学习者的特征进
数学解题在高中生数学学习中发挥着重要作用,通过对学生数学解题的深入观察了解,发现高中生在数学解题中有如下问题:解题时没有计划、没有方向、解题思路单一、容易犯相同的错误等。而这些都和学生的元认知相关,发展学生的数学学科自我监控能力是数学教学的一个核心问题。因此,本研究将自我监控能力与数学解题相结合,以调查问卷为基础分析高中生数学解题自我监控能力的现状、影响因素以及优化建议。首先,对国内外有关元认知、
随着我国经济的快速发展,生态环境问题也日益突出,尤其是在农业领域。由于农业领域的长时间粗放管理,环保意识不足等原因,农业领域之中产生了诸多生态环境问题,逐渐成为我国农业进一步发展的瓶颈。在农业生态环境治理方面,我国政府也在不断加大政策力度,尝试新的政策工具与方法。中共十六届五中全会,我国政府首次提出“按照谁开发谁保护、谁受益谁补偿的原则,加快建立生态补偿机制”,自此我国生态补偿政策作为强有力的生态
样本量的确定是实施抽样调查或者医学临床试验等统计实践的基础工作,合理的样本量既能保证调查或者试验结果的可靠性与准确度,同时能控制调查或试验的费用和成本,在确保试验可信性以及资源节约等方面起着尤为重要的作用。Logistic回归模型在临床医学和药物研发等领域应用广泛。本文针对该模型的样本量计算问题,结合多种不同的信息,给出相应的样本量计算理论,并推导对应的公式。在简要介绍经验法的基础上,详细讨论了公
2019年4月4日,教育部启动实施一流本科专业“双万计划”,旨在通过加增“一流学院”“一流专业”建设,促进我国高等教育从“跟跑着”向“引领者”转变,亦使我国一流本科教育的改革与发展进入实质性阶段。在此背景下,以研究性学习理念为导向的突出学生为中心、学生能力发展为要点、突破了原有的以有组织的定量评价以及刚性逻辑为主的主题框架,重视具有多维度、多层次的过程导向的改革成为高等教育内涵式发展的关键与重点。
随着银保监会陆续公布批准设立的地方资产管理公司名单,以及中美双方签署第一阶段经贸协议,中国将允许美国金融服务供应商申请资产管理公司许可证,除四大国有金融资产管理公司之外的地方资产管理公司、民间投资者、外资机构纷纷向传统不良资产进军,逐鹿万亿不良资产市场。资金的涌入,造就了一个个高价格的资产包,提高了银行出包的底价。作为承接银行一级市场包的资产管理公司等投资者,科学地进行不良资产商业化收购定价,是持
供应链金融以真实交易信息为依据,以核心企业信用为背书,对破解中小企业融资难融资贵问题具有重要意义。2017年10月国务院办公厅发布《关于积极推进供应链创新与应用的指导意见》明确指出“积极稳妥发展供应链金融,推动供应链金融服务实体经济。”“研究利用区块链、人工智能等新兴技术,建立基于供应链的信用评价机制”。平安银行作为我国首个开展供应链金融业务的银行,在“科技引领”的转型背景下,积极响应国家政策,通