改进的协同过滤算法及系统实现

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:redblackzhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的诞生和发展,使得推荐系统得到了广泛的使用,信息的生产者会通过对用户的兴趣进行分析,对信息进行筛选推荐,从而得出用户想要获取的资源。协同过滤算法是推荐算法的一种经典的算法,协同过滤算法忽略了商品本身的内容,利用商品之间的联系,用户之间的联系,对用户进行推荐,但是数据稀疏导致用户相似度计算精度低,推荐不准确问题依然存在。(1)以往的协同过滤算法忽略了对商品属性的挖掘,本文提出一种基于商品属性和用户属性的协同过滤算法。根据用户-商品评分矩阵计算用户对商品属性值评分;通过分析用户的属性对Pearson公式进行改进,根据改进后的用户相似度对用户-商品属性值评分矩阵进行填充,对修正用户相似度后的评分预测公式和根据用户对商品属性值评分构建的商品评分预测公式进行加权得到最终的评分预测公式,最终为用户进行top-N商品推荐。(2)针对传统的计算用户相似度因考虑因子少导致计算精度低的问题,本文对用户相似度公式进行改进,引入了用户-商品属性兴趣度的概念,通过用户对属性的兴趣度形成比例矩阵,得出用户的相似度;提出关联商品,非关联商品的概念,通过关联商品和非关联商品的比例,得到用户相似度;提出商品贡献度的概念,根据贡献度计算用户的相似度,将三种因子得到的用户相似度和Pearson相似度结合,得到改进后的用户相似度计算公式。实验数据采用Movie Lens数据集,通过实验证明,改进后的推荐效果明显优于传统的协同过滤推荐算法。
其他文献
稻田土壤可进行甲烷氧化细菌介导的甲烷好氧氧化作用,是甲烷消减重要过程。氮是作物生长过程中所必需的大量元素,是水稻稳产增产的主要限制因素之一;生物固氮是稻田土壤中活性氮输入的重要来源之一。现已发现一些甲烷氧化菌具有固氮基因,可能会进行生物固氮,但是具体机理及影响因素尚不清楚。一般认为,只有在无氮或氮极度缺乏条件下,土壤微生物才启动固氮功能。因此,通过测定不同土壤样品的甲烷氧化速率和氮矿化速率,筛选出
海冰是目前极地研究的热点话题,融池作为海冰中重要的参数它对海冰的变化有着显著的影响。因此本文利用北极融池、海冰的高分辨率实测影像结合中分辨率成像光谱仪(Moderate-resolution Imaging Spectroradiometer,MODIS)反射率产品反演北极融池与海冰覆盖率。分析了融池与海冰覆盖率的时空变化特征及其与9月海冰范围之间的关系。使用海冰和融池的现场观测影像提取了2786
随着无线通信行业的发展波束赋形技术得到越来越多的关注。波束赋形技术可以广泛地应用在雷达、资源勘探、全球卫星定位系统以及基站天线。本文以最大功率传输效率为研究方法,通过引入二次约束二次优化来对天线的远场方向图进行赋形。通过引入辅助接收天线,与发射阵列天线组成一个远场传输系统,计算该传输系统的散射系数来获得设计所需的幅值相位激励。由于该方法考虑到阵列单元间的耦合以及包含了复杂环境的阵列散射系数,该方法
近年来,可穿戴设备的飞速发展和进步有目共睹,在健康辅助以及军事装备等领域中,可穿戴技术得到了广泛的应用。随着市场需求量的日益剧增,各种各样的可穿戴设备相继出现在市场和人们的日常生活中,常见的有可穿戴智能眼镜、手表、手环等。而作为可穿戴设备的重要组成部分,可穿戴天线的研究吸引了产学研界的广泛关注。常见的可穿戴天线结构有微带天线、倒F天线、纽扣天线等。与手环等一类的可穿戴设备不同,设计在服装上的可穿戴
2013年以来,我国中东部地区冬季伴随着高PM2.5浓度的空气污染事件频发,该地区冬季的空气污染状况及其气象成因越来越成为人们普遍关注的热点话题。基于中国环境监测中心提供的PM2.5浓度数据、中国气象局地面与高空常规观测资料以及欧洲中心的再分析资料,以PM2.5浓度和能见度作为环境空气质量的代表,选择一月代表冬季,探究了2013至2019年我国中东部地区冬季空气污染的成因。主要研究内容和结论如下:
语音情感识别作为目前模式识别、信号处理等领域的研究方向,其在人机交互中的应用逐渐成为人们关注的热点。所谓语音情感识别,即使用一定的算法对语音信号进行情感分类,如将语音信号划分为“高兴”、“悲伤”“厌恶”等情感类别中的某一种。在语音情感识别的研究历史中,已出现大量有效的方法来解决语音情感识别中出现的多种问题,但大多方法使用单一的数据库来研究。然而,在实际的情感识别应用领域,由于数据采集环境、设备等的
文本表示是自然语言处理最为核心的研究方向之一,近年来随着机器学习的发展,文本表示也从最初的统计学方式开始与机器学习相结合。人类对于文本的理解取决于对世界的认知以及大脑复杂的逻辑处理,而计算机则取决于文本在计算机内部存储的二进制表示。如何将文本表示成计算机更易于理解的形式成为了目前的研究热点。本文的核心工作是针对中文文本构建文本表示,并应用在新闻文本分类任务中。如何将中文字符具有含义且包含情感考虑进
稻纵卷叶螟(Cnaphalocrocis medinalis)是水稻生产过程当中为害较重的一种虫害。本文以二龄稻纵卷叶螟幼虫为试验材料,在南京信息工程大学农业气象试验站水稻大田内,设置网罩控制下不同投虫量处理,以无虫量为对照,利用成像光谱仪、便携式地物波谱仪和SPAD-502叶绿素仪测定水稻全生育期叶片成像光谱、冠层非成像光谱以及叶片叶绿素相对含量(Soil and Plant Analyzer
随着温室大棚的普遍性,种植的花卉类别日渐繁多,因此花卉分类以及生长监测过程需要耗费大量的人力物力。且由于花卉种类多,类间差异小、类内差异大,再加上所处环境复杂,传统的图像分类方法不能很好地解决这类问题。针对以上问题,运用深度学习对花卉图像实现自动分类以及叶部病害识别成为了研究的热点,这在园林花圃的智能化管理中具有重要的应用价值。所以,在深入分析了国内外研究成果的基础上,本文以深度学习和迁移学习为理