推荐系统中非随机缺失机制的解释和应用

来源 :厦门大学 | 被引量 : 0次 | 上传用户:soundbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究已经表明在推荐系统中的评分不是随机丢失的。然而,很少有研究去揭示评级是如何缺失的。在本文中,我们提出了一个可能的解释去揭示缺失非随机现象,即沉默螺旋理论。我们使用一系列不同的现实数据集去验证了推荐系统中的沉默的少数群体存在一个螺旋式过程。其中包括:(1)相比于持有多数意见的用户群体,意见落入少数意见的用户群体更不可能给出评分;(2)由于多数意见逐渐变得更具主导地位,多数意见的持有者的评分可能性正在加剧,但是少数意见的持有者的评分可能性正在缩小;(3)当螺旋状态达到稳定状态时,只有硬核用户才会以少数意见进行评分。我们进一步研究和证明了硬核用户具有的特征,其中包括:(1)在不同的评分环境下,硬核用户的行为都是一致的;(2)硬核用户更可能提供极端的评分,即1分和5分;(3)硬核个性和用户的兴趣或经验有关。硬核用户在自己熟悉的方面上更可能坚持自己的意见;(4)硬核个性和道德基准有关。硬核用户更乐于去批评一个受赞赏的项目,而不是去刻意表扬一个受批评的项目。我们的实证研究结果有利于指导未来的推荐模型的开发。为了证明我们的实证研究结果的影响,我们提出了一系列的模拟沉默螺旋生成过程的概率模型,即基于意见气候的条件概率,基于角色的条件概率和基于道德基准的条件概率模型。三者分别考虑意见气候的感知,硬核和非硬核用户,以及项目受批评或受赞赏的性质。我们通过在两个随机非缺失的数据集上的实验证明,与现有的最先进的推荐模型相比,所提出的模型提供了更为准确的推荐结果。
其他文献
推荐系统是当下解决信息超载问题的有效方法,在经过学术界和工业界多年共同的研究和应用后,取得了卓越的研究成果。但是在移动互联网的时代中,数据量呈现几何式增长,传统推荐
随着计算机互联网的飞速发展,数据呈现指数级增长,越来越多的用户选择将数据存储在云服务器。云存储减轻了用户的存储管理负担,为用户提供灵活的云计算服务,但是作为一个第三
基于当前购房行为的复杂性和信息不对等性,以满足群成员对地产信息需求为目的的“长沙看房微信群”应运而生。群成员出于信息和情感的需求加入“看房群”,根据群成员购房需求上的差异,将本群内的成员分为刚需类购房群体、改善类购房群体和投资类购房群体;群内信息丰富,主要可分为开盘信息、楼盘推荐、购房资质研讨、楼市政策探讨和其他非地产相关信息五类。不同类型的群成员在购房需求上存在差异、群内不同的传播信息影响群成员
马其顿有着非常独特的地理位置,它地处希腊世界的北部,区域内包括上下马其顿两个部分,且双方长期处于分裂的状态,直到国王亚历山大一世时期才被统一。此外,马其顿与诸多蛮族部落比邻而居,形成了极为彪悍的民风,与主流的希腊城邦有所区别。分裂的政局与边缘的地理位置,使得马其顿民族虽然一直同希腊的城邦保持联系,但是在很长一段时间内仍然没有被认同为希腊人的一员。这种局面直到腓力二世统治的时期才发生了改变。腓力二世
目前,随着科研设施和仪器规模不断扩大,覆盖范围不断增长,综合效益得到了快速地提高,但是也出现了仪器闲置、浪费等利用率较低的情况。为了更好的提高仪器资源利用效率,政府提出搭建统一的网络管理平台,实现科研设施与信息资讯共享的全链条有机衔接。为响应号召,仪器共享平台迅速在多高校搭建完成,特别是预约、管理、监督与评价等科研设施模块已经投入使用,但资讯共享模块中又出现了点击率不高,兴趣不大的问题,推荐的新闻
近年来,城市道路管理部门经常会在某些路段设置一些路障或者标志物,有的是平面图案,而有的是一些立体指向标识。这些平面图案具有高度的立体性和真实性,导致辅助驾驶系统无法判断其真实性,在路面产生突发状况时,很可能因为误判造成严重事故。本文对如何区分道路平面图案与立体目标进行了研究,并给出了一种识别方法。主要研究内容如下:(1)通过学习平面图案和立体目标的区别,利用射影不变量这一稳定特征,将计算机视觉理论
传统的成本性态分析理论认为,企业业务量与成本费用之间是线性关系。该成本性态理论成立的前提条件是企业处于一种理想状态下,但是现实中很多外在因素会对公司成本费用的管理
我国经济发展迈入速度放缓、结构优化和动力转换的新常态阶段,稳增长、调结构、重质量是当前发展的重点。同时,新一轮的科技革新和产业升级蓄势待发,学科多点突破、产业交叉融合的现象日益明显。知识、服务、信息、技术要素的强关联效应和外溢效应推进了产业融合、催生了一批融合型的新产业、新业态、新商业模式,从根本上变革了生产、生活方式。融合深化模糊了三次产业的边界,赋予了产业结构升级新的特征。本文探索产业融合深化
在信息总量爆炸式增长的背景下,互联网用户需要更快捷的方式从海量的信息中获取有价值的一部分,而问答系统就是可以完成这种任务的工具之一。目前,问答系统在诸多场景下都得到了应用,开放领域的问答系统可以作为一个强化版的搜索引擎,对用户输入的问题作出准确回答。同时,在各个领域的客服系统中,问答系统也有着广泛应用。相比于雇佣人工客服的方式,部署在线问答系统可以有效降低人工成本,同时能够保持长期在线。与此同时,
随机森林作为一种组合分类技术,因其抗噪声能力强、易于并行化等诸多优势被广泛应用于人工智能、机器学习、模式识别等领域。但随机森林在模型建立过程中优劣程度不同的子树