【摘 要】
:
随着互联网与信息技术的飞速发展,电子商务系统规模的扩大造成信息过载问题日趋严重,个性化推荐系统成为解决这一问题的关键技术。在过去的研究中,基于单一领域的协同过滤技术成为当今推荐系统中应用最为广泛的技术,但该技术存在着两个亟待解决的问题,也就是数据稀疏问题与冷启动问题。为了解决这两大问题,跨领域推荐技术成为目前推荐领域的一大热门话题。该技术利用用户在其他领域中的相关行为信息,对用户在目标领域的偏好进
论文部分内容阅读
随着互联网与信息技术的飞速发展,电子商务系统规模的扩大造成信息过载问题日趋严重,个性化推荐系统成为解决这一问题的关键技术。在过去的研究中,基于单一领域的协同过滤技术成为当今推荐系统中应用最为广泛的技术,但该技术存在着两个亟待解决的问题,也就是数据稀疏问题与冷启动问题。为了解决这两大问题,跨领域推荐技术成为目前推荐领域的一大热门话题。该技术利用用户在其他领域中的相关行为信息,对用户在目标领域的偏好进行预测,提高推荐的多样性,同时弥补了数据缺失造成的推荐效果较差的问题。然而现有的算法仍存在着较多的问题,如只能完成跨单一领域的推荐、推荐结果无法满足用户个性化需求、推荐算法复杂度较高,存在性能问题等。基于以上问题,本文利用自然语言处理领域的语义分析知识,结合聚类方法与推荐领域中应用最为广泛的协同过滤技术提出一种基于多领域语义融合的推荐系统,主要研究工作与取得的成果如下:(1)提出一种基于语义分析的相似度度量模型。该模型旨在利用语义分析方法,计算两个领域标签的相似度矩阵,通过项目标签的跨领域迁移计算两个领域中各项目之间的相似度。该方法利用项目标签语义相似度得到两个领域间项目的相似度。较现有跨领域项目相似度计算模型,本文提出的相似度度量方法可解释性更高,适用领域范围更广。实验表明本方法可以得到准确度更高的项目相似度结果。(2)提出基于多领域聚类的协同过滤模型。考虑到基于相似度度量模型的推荐方法计算性能较差且难以满足用户的个性化需求,基于多领域聚类的协同过滤模型利用项目聚类的方法查询项目最近邻,提高运算性能,结合协同过滤算法的优势,加入对长尾分布的处理,对用户相似度算法加以改进,满足用户的个性化需求,同时,考虑到领域相关度,加入权重处理算法,更有效的对多个领域数据进行融合。本方法与传统的跨领域推荐算法相比有着更好的推荐效果,同时节约时间开销、空间开销。(3)设计实现基于多领域语义融合的推荐系统。利用传统的单一领域推荐算法与基于多领域语义融合的推荐算法相结合,为涉及多领域数据的平台提供一个完整的推荐系统,该系统能够统计用户收藏、用户评分等个人行为数据,也可以根据用户数据得到两种算法的推荐结果。该系统可以充分满足用户的个性化需求,不仅可以得到传统推荐算法更为成熟准确的推荐结果,同时可以利用多领域数据进行跨领域推荐,缓解传统推荐算法中的冷启动问题与数据稀疏问题。
其他文献
近年来,随着双语教育和国家通用语言推广工作的开展,新疆少数民族国家通用语言水平有所提高,其中提高的原因值得深入探讨。该选题以李志忠教授对新疆各民族语言状况的调查数据及其所作《新疆少数民族普通话普及度抽样研究报告》(书稿)中的相关数据为基础,选取从低级行政区域流动到高级行政区域的少数民族流动人口进行深入访谈,在理性数据中加入感性材料,探索流动人口学习国家通用语言的有利条件。对其流动前后国家通用语言水
休闲是人的一种状态,是自由精神的象征,也是人类发展的深层次动力和目标。随着商品经济的发展、科学技术的进步,国民生活水平大幅提升,中国紧跟发达国家进入休闲时代。城市务工女青年作为休闲经济和休闲文化的重要参与者,其休闲满意度既是对生活质量的客观反映,也是对休闲生活质量的主观评价。本文选择宜昌务工女青年作为主要调研对象,对其休闲时间、主要休闲方式、休闲动机、休闲质量、主要精神压力与困扰、自我满意度等方面
近年来,高校社会安全类突发事件时有发生,引起公众的广泛关注。高校作为科研和培养新时代高层次人才的基地,深受国内外政治社会环境的影响。随着互联网的迅猛发展,当前大学生群体成为各类社交媒体的主要用户,他们关注国内外政治和社会热点,但由于他们价值观塑造尚未成型,会受网络上各类真假信息的影响和引导,有些也会变成所谓的“吃瓜群众”和“键盘侠”,高校内发生的一切都有可能在网络发酵的作用下形成网络热点舆情,引发
大量研究显示视网膜各层组织的厚度与不同眼部疾病的严重程度具有良好的相关性,眼底视网膜各层组织结构厚度的变化能够提供相关疾病的有用诊断信息。光学相干断层扫描(OCT)眼
单载波频域均衡技术可以有效地对抗频域选择性衰落信道,使用频域均衡技术的单载波系统与OFDM系统具有基本相同的误码率性能和复杂度,而且具有良好的峰均比特性,但是当窄带干
20世纪90年代以来,财务重述现象在世界范围内经历了从出现到频发再到愈演愈烈的过程。财务重述的本质,是对前期财务报告中的差错或模糊信息进行更正或者补充,从而加强会计信息质量,以减缓公司内外部的信息不对称,维护投资者权益。然而,重述公告的出现同时也意味着公司前期财务报告质量受损、会计信息的可信度较低,不仅扰乱了资本市场信息披露环境,也损害了投资者信心。财务重述的根源是公司治理出现问题所以未能发现财务
那云农场是一个拥有六十多年历史的生产型大企业,在这六十多年里,企业的所有产品都是上交国库的,因此为国家的农产品供应曾经做出了巨大贡献。2013年在进行了国有企业的改制后,企业不得不自己寻找市场,在数字化、智能化、国际化的今天,市场大浪淘沙、瞬息万变,那云农场难以适应这样残酷的、激烈的竞争环境,虽然经过几年的努力,但经营状况依然不理想,企业正在生死攸关的转折关头!通过本文的研究,我们将运用市场营销的
图像修复(Image inpainting),是指利用图像已知区域中的像素信息,对缺失区域进行填补修复的过程。图像修复是图像处理中一个经典的且具有挑战性的课题,在图像编辑、图像合成、基于图像的渲染和计算摄影等领域有着广泛的应用。目前图像修复算法面临的挑战,一是生成准确的整体结构,另一个是合成生动的纹理细节,使得修复后的图像在视觉上真实合理。传统的图像修复算法的修复效果随着缺失区域面积的增加而直线下
学校教育是教育制度重要组成部分。教育以质量为永恒的主题,质量是教育的生命线,是学校生命力和竞争力的体现。因此,学校的全面可持续发展的首要任务是不断提高教学质量。“
随着云计算数据中心在全球范围内的发展和应用,它带来的一些问题,如能耗消耗过快、费用过高、污染越来越严重,都将变得越来越明显。为了节约能源消耗,绿色新能源的使用成为很多云服务商的发展重点,利用绿色能源为其数据中心供电。各类绿色能源的出现对环境保护的意义重大,并且为可持续发展提供了有力的支持。其中,应用推广最为广泛的是太阳能和风力风电两种绿色能源,且最受各个国家的重视,绿色能源的推广应用,在很大程度上