【摘 要】
:
随着互联网的飞速发展,人们已经进入了数据爆炸的时代,数据的数量可以代表一个企业的发展能力,数据的质量能够推动企业产品的更新迭代。面对如此海量的数据,如何快速地为用户提供有用的、关键的、感兴趣的信息变得十分的重要,因此推荐系统应运而生。而协同过滤推荐系统则是推荐领域应用最广泛的技术之一。本文通过研究传统的协同过滤推荐算法,以及该算法所面临的K近邻(K nearest neighbours,KNN)攻
论文部分内容阅读
随着互联网的飞速发展,人们已经进入了数据爆炸的时代,数据的数量可以代表一个企业的发展能力,数据的质量能够推动企业产品的更新迭代。面对如此海量的数据,如何快速地为用户提供有用的、关键的、感兴趣的信息变得十分的重要,因此推荐系统应运而生。而协同过滤推荐系统则是推荐领域应用最广泛的技术之一。本文通过研究传统的协同过滤推荐算法,以及该算法所面临的K近邻(K nearest neighbours,KNN)攻击问题,以获得协同过滤推荐系统抵御攻击能力和推荐精确度之间的平衡为目标,设计了一种用于抵御随机攻击的协同过滤推荐算法(Resist Random Attacks on Collaborative Filtering,RRACF)。通过引入Elasticsearch搜索技术,设计了一种基于Elasticsearch的用于抵御随机攻击的协同过滤推荐算法(Resist Random Attacks on Collaborative Filtering with Elasticsearch,ES-RRACF)。RRACF算法通过使用Z-score数据规范化技术、用户的兴趣漂移权重以及Laplace加噪机制来抵御随机攻击,同时又使得算法拥有较好的推荐精确度。而ES-RRACF算法在RRACF的基础上,通过使用Elasticsearch搜索技术代替传统的通过计算用户之间相似度的方式来选取最近邻居集合,大大节省了算法的计算时间。为了验证算法的有效性和实用性,本文利用MovieLens数据集,对上述算法进行了实验仿真,并将ES-RRACF部署在一个电影推荐原型系统中进行测试,结果表明,ES-RRACF算法具有应用价值,能够使得推荐系统更加的鲁棒。
其他文献
随着计算机技术和移动互联网的发展,智能移动终端已成为大众上网的主要设备,极大地改善了人们的生活。在智能移动终端上,各种基于位置服务的应用应运而生并日渐丰富,着实为用户带来了诸多便利。顾名思义,基于位置服务的应用需要获取用户位置信息来进行服务,而位置信息常可以与其他信息如时间或用户身份等相关联,应用可以进而推知用户的隐私信息。如根据用户夜间常在地可以推测用户住址、根据用户日间所处位置可以推测用户工作
低轨卫星系统近年来受到国内外广泛关注,各国都在努力部署低轨卫星星座系统,低轨卫星通信系统中功率受限,因此需要一种纠错能力较强的信道编码方案。卫星选择信道编码方案时应将卫星实际情况与编码复杂度等因素结合起来进行综合考虑,从而确定适宜的编码方法和对应的解码方法。由于低解码复杂度和并行解码,同时为了顺应5G与卫星融合的趋势,卫星应更多使用地面5G现有基站资源,LDPC(Low Density Parit
磁场是地球的基本属性之一。在地震预测领域地磁异常作为可能成为孕震的标志,国家地磁台网通过建设台站将专业设备采集到的高精度地磁场要素数据公布,以促进相关领域的研究。而通过台站作为地磁源数据获取手段有其局限性:一、对于短周期的地磁异常,台网的数据订阅式共享对于用户缺乏有效的机制为获取异常时间点附近的细节数据提供支持。二、目前地磁台站最短采集间隔为1/32秒,大多数台站为1秒,对于毫秒级甚至更低的采集间
近年来随着聚类算法应用领域的扩大,可处理的数据类型日趋丰富,基于图论的聚类方法引起越来越多的关注,新的和改进的算法不断被提出。但是,新的应用需求层出不穷、不断变化,且现有的方法也存在不足,因此要对现有方法进行改进,提出新的理论和方法以满足新应用的需求。本文通过对基于最小生成树(Minimum Spanning Tree,MST)的聚类算法的研究分析,发现该算法在执行的过程中利用贪心算法生成MST,
随着国家加大对公共安全问题的重视,公共场所的视频安全监控发挥着极其重要的作用。安全部门可通过监控系统对行人进行特征及身份识别。传统的生物特征识别方法包括人脸识别、虹膜识别等,但是由于摄像头与行人距离较远,拍摄图像不清晰、人脸模糊等问题,传统的身份识别方法已经无法满足当下的需求,而步态识别因其具有远距离可识别、分辨率要求低等优点,成为计算机视觉领域的研究热点。因此,本文对基于步态特征的目标人体检测及
随着移动通信技术进入5G时代和物联网技术的迅速发展,万物互联的“智慧城市”将不再是遥不可及的概念。在新一代移动通信技术的支持下,将会有海量的机器类通信(Machine Type Communication,MTC)设备接入网络,用于智能测绘、可穿戴设备、自动驾驶以及智慧医疗等领域,这种应用场景称为大规模机器类型通信(Massive Machine Type Communication,m MTC)
随着移动互联网的高速发展,电子商务和在线社交网络等Web2.0应用快速普及,随之产生了海量且动态变化的用户行为数据。用户评分数据是一种重要的用户行为数据,反映了用户对相关产品或服务的喜好程度。通过分析这些用户评分数据并建立用户偏好模型,能够为精准广告推荐、用户画像等个性化服务提供重要的数据和技术基础,且具有重要意义。近年来,许多研究人员提出了利用隐变量模型构建用户偏好模型的方法,以描述评分数据中的
目的:构建藻蓝蛋白/羧甲基壳聚糖-CD55特异性配体肽纳米微球(CPC/CMC-CD55sp),并研究CPC/CMC-CD55sp对宫颈癌细胞(Caski)的靶向抗肿瘤作用及其机制。方法:CMC作为载体包裹CPC构建纳米微球,表面通过离子交联连接CD55特异性配体肽(CD55sp)形成CPC/CMC-CD55sp纳米微球。以其通过CD55配体肽与Caski细胞表面CD55的特异性结合完成其靶向递送
随着移动通信技术的飞速发展,无线应用对速率需求的爆炸式增长与无线频谱资源紧缺的矛盾日益涌现,提高有限频谱利用率的技术是近年来蜂窝网络研究的重点。其中,设备与设备(De
2020年是全面建成小康社会和"十三五"规划收官之年,是实现第一个百年奋斗目标、为"十四五"发展和实现第二个百年奋斗目标打好基础的关键之年。2020年国资国企工作的总体要求