Netflix数据集上的协同过滤算法

被引量 : 0次 | 上传用户:tiankoufangfangtu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息爆炸的互联网时代的到来,帮助用户从海量数据中发现有价值的信息越来越重要。推荐系统利用系统已知的用户对对象的偏好程度,通过信息过滤,发现用户潜在的感兴趣的对象,并主动推荐给用户。推荐系统的信息过滤算法分为基于内容文本的过滤算法和基于用户-对象关系的过滤算法,后者也称为协同过滤算法。对于海量数据的处理,基于内容文本的过滤算法在性能方面遇到很大瓶颈,实用的算法主要是各种协同过滤算法。协同过滤算法使用的主要技术包括回归、矩阵分解、神经网络、K近邻等。协同过滤算法研究中,最流行的数据集之一是Netflix数据集。Netflix于2006年设立Netflix奖,公开了该网站用户对电影评分的部分数据,包含约一亿条用户-电影评分记录,供算法研究者实验,并提供在线评估算法结果的服务。本文的工作包括:1、分析了Netflix数据集的若干统计特性,对实例相关的算法的设计给出了指导。证明了与均方根函数相关的若干不等式,应用到舍入误差分析、误差校正、算法收敛性分析等方面;2、对现有协同过滤算法的数学模型进行了整理,改进了若干相对成熟的算法,对模型的物理意义、算法实现的技术细节、训练算法的收敛性、复杂性、稳定性和扩展性等方面进行了广泛而深入的研究;提出了新的模型和算法,其中首次将效用曲线、意见领袖等来自社会科学的观点引入协同过滤算法的设计;3、提出了新的问题,针对在线应用中推荐系统的实际问题,提出了新的评估协同过滤算法质量的量化指标,并依此对比分析了若干算法的优劣。
其他文献
为了提高交通监控和管理的智能化水平,越来越多的“电子眼”部署在城市交通路口和重要的地段,其发展趋势也向着高清化、网络化、智能化方面发展,以视频图像处理、分析、理解
作为诗人、小说家、评论家、马克思主义者、电影导演及理论家,帕索里尼从多个角度思考人与现实的存在及关系。1965年的世界电影符号学会议上,帕索里尼发表了他的第一篇论文《
近年来,志愿服务活动在我国几乎家喻户晓,志愿服务意识为大多数公民所接受,大学生参加志愿服务已经成为其接受教育的重要部分,在我国大学生志愿者是志愿服务队伍的主体,担当
如何提高教师的教学水平,一直是教师教育研究的重心。无论在大学的专业学院还是在教师实际的工作场所,培训教师,既是教师教育产生以来聚讼不休的核心话题,也在一定程度上反映
厚朴主要来源厚朴Magnolia officinalis及其变种凹叶厚朴M.officinalis var biloba。历史上按产地分为川朴(产于湖北和四川,来源于厚朴)和温朴(产于浙江和福建,来源于凹叶厚
目的:研究蛛网膜下腔注射不同剂量NAAG肽酶抑制剂2-磷酸甲基戊二酸[2-(Phosphonomethyl)-pentanedioic acid,2-PMPA]对切口痛大鼠的镇痛作用.方法:雄性SD大鼠30只,随机分为切口痛
饶戈平主编北京大学版大32开 320千字 408页平装估价:13.80元1996年6月出版 ISBN 7—301—03108—4/D·308本书包括国际组织在国际社会中的地位、作用和历史演进,国际组
文中针对氧化铝热电厂25 MW汽轮发电机组的运行特点和性能,介绍了25 MW汽轮机液压调节系统由低压透平油改成高压抗燃油DEH改造的方案,并提出了改造的创新特点,以及改造调试过
手语通过手的形状、位置、运动、朝向和面部表情等通道表达特定的信息,是聋哑人与聋哑人之间、聋哑人与健听人最主要的交流方式。手语识别研究能够使得有听力障碍的人与外界
21世纪,企业的财务目标由利润最大化向价值最大化转变。如何寻找合适的绩效评价指标来评估企业是否达到价值最大化,并在此基础上建立激励机制,使得经营者和股东的目标一致,朝