一种基于标签质量挖掘的物品推荐方法

来源 :武汉大学 | 被引量 : 0次 | 上传用户:rossifish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在推荐系统中,用户和物品是两个核心的实体。在社会化推荐领域,标签是除了用户和物品之外的另一个重要的实体。标签在社会化推荐系统中帮助用户有效地描述、分类和导航各种各样的物品。从这个角度看,标签是用户和物品之间的桥梁。因此,用户-标签-物品三元关系在推荐系统中可以提供丰富的、有利于推荐的信息,许多研究工作者为挖掘这种三元关系做了许多工作。然而,很少有研究者关注标签质量的挖掘;而且,已有研究多数关注整体的三元关系,很少区分用户-标签和标签-物品这两种二元关系之间的差异。针对已有研究的不足,本文提出一种新颖的标签质量挖掘方法,用于辅助产生物品推荐。这种方法通过在两个空间(标签-物品子空间和用户-标签子空间)中独立挖掘高质量来完成。本文的具体工作为:1、在标签-物品子空间中挖掘主导标签。其中,主导标签是标签-物品子空间的高质量标签。接着,为每个标签确定主导标签,这些标签成为主导标签的下级子标签。最后,建立标签引导概率模型(LeaderProb),通过主导标签与下级子标签共享标签质量,提升低质量标签。2、在用户-标签子空间中挖掘规范化标签。首先,在子空间中剔除冗余兴趣规则,非冗余规则中的前件标签即为规范化标签。然后,建立规范化标签概率模型(RulerProb)。最后,通过规范化标签挖掘用户的潜在兴趣,获取用户更多的兴趣标签。3、将标签-物品子空间和用户-标签子空间通过挖掘的标签结合在一起,建立复合概率模型(ComProb)。找到用户-物品的二元关系,通过ComProb实现最终的物品推荐。实验在Last.FM和CiteULike两个真实数据集上展开,结果表明,对子空间进行标签质量挖掘对提高物品推荐性能有积极的影响。
其他文献
从遥感图像中提取建筑区域面积对于评估一个地区的发展程度具有重要的意义。光学遥感图像易受天气影响,还会发生云雾遮挡,而具有全天时、全天候成像特点的合成孔径雷达(Synth
许多开源软件都是Internet的重要组成部分,例如Sendmail、Apache、Linux、MySQL等。同时,开源软件也是支持全球电子商务的IT基础架构的重要组成部分。Gartner在2011年发布的
近年来,软件缺陷预测在软件质量保障和软件维护领域变得非常流行。由于项目内软件缺陷预测(Within Project Defect Prediction,WPDP)对数据集的依赖性较强,对于新创立的软件
数据库是人类对于信息管理的一个重要的发明。随着信息化技术的发展,互联网产生了数据量庞大的,类型多样的数据。存储和管理这些复杂多样的数据变成了一个极大的挑战。基于关
PT对称的概念来源于量子力学。由于PT对称系统的本征值可以全部为实数,这打破了可观测物理量对算符厄米性的要求从而使得PT对称引发了大量的研究热点。在光学中,傍轴近似下的
本论文中,报道了一个简单而有效的配体触发的静电自组装方法,制备了一系列CdS纳米片/Au复合纳米材料(Au-CdSNS)。利用Au纳米粒子表面的正电荷及CdS纳米片表面的负电荷,经过静
贵金属纳米催化剂的性能与其表面元素组成与分布、界面处物质及能量流动等因素密切相关。对于众多发生在表界面处的催化反应,表界面结构的科学调控被认为是提高贵金属纳米材
随着万物互联时代的到来,各种互联业务不断涌现,用户对无线通信系统中的传输速率和容量需求日益增长。带内全双工(IBFD)通信可以在同一频带内同时支持双向射频信号传输。对比
差分码偏差(DCB,包括卫星DCB和接收机DCB)既是GNSS提取高精度电离层TEC估计值的重要误差源,又是衡量接收机硬件性能的重要指标,同时对定位和授时具有显著影响。目前接收机差分码偏差的研究仍局限于美国GPS及俄罗斯GLONASS,且已发布的接收机DCB产品种类偏少,难以满足当前GNSS应用对多模多类型接收机DCB的需求。随着美国GPS、俄罗斯GLONASS系统的不断现代化以及欧盟GALILE
随着我国经济的快速发展,人们生活水平得到提高和改善,网球运动愈发受到人们的广泛关注和青睐,越来越多的青少年开始加入网球训练当中。本文对杭州、宁波、温州三地的青少年