基于中位数的用户信誉度评估算法设计与实现

来源 :复旦大学 | 被引量 : 0次 | 上传用户:gaolch011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会网络的日益壮大,人们越来越重视知识的共享,基于web的打分评价系统在电子商务与消费点评网站中的应用也越来越广泛。此类网站中广泛存在着用户和对象两种实体:用户可以给对象进行打分,系统根据用户的打分计算出对象的最终评分,而最终评分的高低影响着对象的排名。用户在选择购买某种商品服务时,通常会参考产品的评分,并根据系统提供的其他用户的已有经验做出选择,为了引导用户选择某个特定的产品,Spammer(这里泛指某些有恶意网络推广行为的人),将排名系统作为自己的重点攻击对象。如何提高评分系统的准确度,是近年来数据挖掘领域的研究热点。一个优秀的排名算法应足够健壮,在有噪声的实际应用环境中依然可以提供相对准确的对象最终评分和排名,从而减轻Spammer攻击的影响。算法还应具有可收敛等特性,否则很难被应用到实际环境中。为此,现有较多研究引入用户信誉度的概念,通过衡量用户信誉度的高低来重新调整用户打分的权重,从而提高排名算法的健壮性。本文将深入讨论该领域的各种算法,并在已有算法的基础上,提出一个更为健壮、高效的新算法,从而提高打分系统排名结果的准确度。本文的工作主要包括:●介绍国内外基于用户信誉度的评分推荐系统算法的研究现状,阐述两种主要的推荐系统类型:内容驱动型和用户驱动型。●阐述用户驱动型算法的模型结构,详细介绍已有的用户驱动型算法,分析并总结各种算法的优缺点。●在对已有算法进行实验、分析的基础上,利用中位数不易受极端打分影响的特性,提出基于中位数的用户信誉度评分算法,LIMED和L2MED。●在多个真实的数据集上对上面提出的两种算法进行实验。第一,将对比各算法计算得出的对象得分与Benchmark之间的相似度以及各算法的信誉度分布;第二,简单介绍协同过滤算法的思路,并将LIMED和L2MED算法预处理后的数据应用于SVD++上,与原有数据集上运行得出的RMSE值进行对比,结果比无处理的原始数据上得到的结果更为优秀,表明了算法的有效性。
其他文献
液力变速箱测试台测控系统是集机电液一体化,自动化程度很高的综合性的大型测控系统,涉及机械、电子、计算机、自动控制、检测和识别等众多学科领域,对液力叉车变速箱的测试具有重要的应用价值。 本文针对变速箱检测的要求对液力叉车变速箱测试台计算机测控系统进行了设计并予以实现。 本文介绍了测试台的组成及PC工控系统中数据采集卡的选用,功能及工作流程。在讨论模糊控制的基本原理的基础上,针对变速箱检测
自从八十年代末期SNMP(Simple Network Management Protocol)简单网络管理协议面世以来,网络管理技术在短短的十几年里得到了突飞猛进的发展,随着管理功能的增强和管理对象的扩
随着无线通信、分布式计算和人机交互等技术的迅速发展和相互融合,普适计算已融入到人们生活中的方方面面。在普适计算环境中,用户的数量及其位置不断变化,要求系统中的计算设备
医疗保险系统与医院信息系统共同实现医疗保险消费,现阶段医疗保险系统普遍采用与医院信息系统紧耦合的业务交互方式,同时业务实现时没有清晰的逻辑部署,当业务发生变化时,整个医
论文结合电子制造公司的具体实际情况, 以制造性企业的需求改变为驱动力,从Internet Call Center客户服务管理系统的建立入手,结合CRM理念及制造业的特点,探讨现阶段制造业CRM的
本文首次提出研究带发点和收点的容量网络扩充问题。定义网络最大流为网络容量,给出了可扩充弧算法和最优扩充弧算法及可扩充弧组算法和最优扩充弧组算法;还讨论了限制容量参
网络环境下的自主学习是基于计算机网络的自主学习。学习要素由原来基于课堂教学的学习者、内容、技术、教师而重组为学习者、资源、网络学习环境、教师。基本要素的变化使学
本文探讨了基于Portal技术构建的校务管理系统中的访问控制问题,提出了在国内高校应用Portal技术建设校务管理系统时可供参考的访问控制模型.在此模型中,采用基于角色的授权
本文的研究目标是为了寻求一种手段,解决现存MRP系统所存在的这种缺陷,考虑如何改善MRP的作业方法,使得在MRP运算的基础上可以根据可用能力和可用物料的信息来调整生产计划。为
近年来,随着网络、无线移动通讯技术的飞速发展,像PDA、SmartPhone这样的消费类电子产品逐步深入到人们生活的方方面面,而移动设备也将成为Web信息的主要发布平台,但针对像PD