【摘 要】
:
随着互联网、物联网、移动互联网的飞速发展,海量的数据信息产生了信息过载问题。尤其在大型电影推荐网站,如何通过一种有效的机制来帮助用户快速的获取到想要的电影信息,这
论文部分内容阅读
随着互联网、物联网、移动互联网的飞速发展,海量的数据信息产生了信息过载问题。尤其在大型电影推荐网站,如何通过一种有效的机制来帮助用户快速的获取到想要的电影信息,这已成为了当前研究的一大热点和难点问题,其中推荐系统是其研究的主要内容。目前国内外针对推荐系统的研究主要集中在协同过滤推荐、基于内容的推荐、基于知识的推荐和组合推荐四个方面。协同过滤算法以其独特思想和便捷的计算方式在推荐系统领域得到了广泛的应用。但随着系统中用户和项目规模的不断增大,传统协同过滤算法在处理效率、稀疏性和拓展性方面存在不足。本文基于协同过滤中的隐语义模型,首先介绍了模型的理论方法,然后针对评分矩阵高度稀疏的问题,利用k-means算法对模型进行了改进。同时为了提高模型的推荐精度和预测准确率,在模型中加入时间上下文信息。文章主要的工作内容有:1.基于推荐系统的原理和方法,介绍了基于领域的协同过滤算法和基于模型的协同过滤算法理论。2.针对用户评分稀疏问题,利用k-means算法对用户数据进行聚类;然后根据聚类结果重构评分矩阵,显著的降低矩阵维度和稀疏度;最后通过修改模型的评分策略得到改进隐语义模型K-LFM。3.为了提高模型的精度,将时间上下文信息加入到传统的“用户-项目”二维推荐过程。通过改变模型的矩阵分解形式,实现对“用户-项目-时间”三维评分矩阵的分解,在提高模型精度的同时实现了对模型的拓展。4.在movielens数据集上实验对比算法的性能,同时借助Hadoop平台的Mahout组件设计实现了一个推荐引擎原型。
其他文献
随着计算机技术的发展,计算机软件的作用越来越重要,涉及人类社会的各行各业,用于解决复杂的实际问题。为了不断满足用户的新需求以及不断适应应用环境的改变,构成软件系统的
基于属性的密码技术将非对称密码方案中标识用户唯一身份的公钥替代为能标识用户的属性集合,通过设置访问控制结构达到实现数据机密性的同时,实现细粒度访问控制和一对多通信
随着计算机技术、多媒体技术和网络技术的快速发展,视频信息在人们获取的信息中占的比重越来越大。如何有效并且快速的管理和检索海量的视频信息成为亟待解决的问题。由于基于
正序列模式是只含有发生元素的序列,而负序列模式是不仅含有发生元素还含有不发生元素的序列,这种含有发生元素和不发生元素的负序列模式在深层次理解序列和处理一些商业问题
伴随着经济一体化、全球化趋势的发展,集装箱运输保持了较高的增长速度,为中国的集装箱运输的发展带来了新的机遇与挑战。集装箱发展迅速并且会持续增长,如何对港口集装箱物
伴随着测序技术的重大改革以及新一代测序技术的兴起,人类基因组草图的完成以及千人基因组计划的开展,无一不昭示着个人基因组时代的到来。如何管理这些海量的异构的个人基因
移动智能终端的普及促进了基于位置服务(LBS)的快速发展,LBS的广泛应用给人们日常生活提供了极大的便利,带来了广阔的市场和商机,但同时也存在着隐私泄露的风险,位置隐私的泄
非真实感绘制技术是当今计算机图形学研究的热点问题之一,它不像真实感图形学那样追求像照片一样的真实感,而是希望通过忽略图像中的一些不重要的细节,来突出图像要表达的信
无线传感器网络是由大量分布在特定区域的无线传感器节点组成的,这些节点能够协作地实时监测、感知和采集各种环境或监测对象的信息,并对其进行处理,传送到用户,具有无线通信、传
互联网已成为全世界范围内的信息传播和资源共享的平台,但随之而来的诸多问题也日益显现。如何保障信息的安全与个人的隐私是一个关键性的问题。匿名通信技术是一种保护信息