推荐系统中标签推荐的研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:tianledaishumama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0网站的日益发展,用户除了是网络资源的浏览者外,同时还是资源的生产者。社会标签系统是Web2.0的一个典型应用,用户主动产生标签,并通过标签标识、管理和发现信息资源。基于标签的推荐是当前标签系统的一个研究热点,旨在减轻用户负担,帮助用户选择合适的标签完成操作。  标签推荐算法是一个标签推荐流程的核心,推荐算法的好坏很大程度决定了最终的推荐质量。虽然国内外对标签推荐算法进行了一定研究,但仍存在部分问题,如不能区分标签推荐场景、推荐信息源单一、推荐集缺乏个性化等等。  为了提高用户体验性,促进标签系统进一步发展,本文对标签推荐的相关理论及技术进行了深入研究。首次提出区分标签推荐的不同应用场景:资源标注和资源搜索。然后详细分析了两种场景下用户使用标签的不同动机和需求,在此基础上提出对应的标签推荐算法p-Co-mixed和PH。p-Co-mixed算法综合了资源热门标签集、用户常用标签集以及用户历史标注行为中的标签共现性,在保证推荐集准确性的同时,提供更符合用户标注习惯的标签集;PH算法通过一个随机向量将近期流行的基于图论的Probs算法和Heats算法结合起来,并创新地用于标签推荐中。最后针对不同的标签推荐场景提出相应的评价标准,并通过在Delicious和MovieLens数据源上进行实验分析,证明本文提出的算法是可行和有效的。
其他文献
大数据的几个特性中,关于数据多样性的研究较少。度量空间数据管理分析方法把数据抽象成度量空间中的点,具有高度的通用性,是应对大数据多样性挑战的有效手段之一。由于度量
随着信息技术的高速发展,面向服务的架构(SOA)的出现极大地提高了软件开发的效率,但同时由于Web数据与资源共享程度的不断提高,资源的安全问题却变得越来越严重,如何支持分布式环
随着数据中心应用提出的需求不断变高,数据中心网络作为数据中心的重要组件,其负载也变的越来越大。这样导致拥塞情况频繁的发生,容易形成一种被称为incast的吞吐量大幅下降的现
多点监测无线传感网络中,由于节点能量有限和数目众多的特点导致网络的寿命受到限制。网络中数据包的无线收发消耗了节点的大部分能量,在无线传感网络内部的传感数据汇集过程
本文根据WSN网络自身的特征,给出了路由协议所需要的设计原则,详细分析了多路径路由协议,基于这些多路径路由协议的特点,开展了针对SMR协议的进一步研究。同时针对基本的蚁群
全球变暖与人类活动产生的温室气体和气溶胶有直接联系,而人类对温室气体的认知水平高于气溶胶。大气气溶胶不仅通过吸收和散射太阳辐射直接影响大气系统的热量平衡,而且作为云
互联网的飞速发展使得人类的信息总量呈现出指数级增长的趋势,为了使用户能够更快更准确地在海量的资源中找到与当前需求相关的信息,信息检索技术应运而生。目前,搜索引擎作为信
人脸识别技术是计算机视觉领域中的一个重要研究方向,被广泛应用于安防监控、金融系统、电子商务等场景。深度卷积神经网络的发展和海量数据的涌现,使得人脸识别的技术可以达到非常好的效果。不过与此同时,网络结构的复杂度越来越高,规模也随着增大。另外,与理论研究的场景不同,在实际应用中,基于这些网络结构的人脸识别技术将会遇到非常多的挑战,如系统容量、算法准确率、开发简易性等等。现有的深度卷积神经网络模型通常对
学位
科技项目检测属于文档复制检测技术的一种应用类型,它规范了科技项目奖励的制度,是检测同一项目是否重复报奖的一项重要措施。科技项目奖励机制旨在对已有的科技成果给予奖励,肯
随着我国教育事业的发展和教育思想的进步,传统的考试方式暴露出越来越多的弊端,无纸化在线考试系统得到了广泛的普及和应用,但还存在许多问题,尤其在智能阅卷领域。目前,针