协同过滤推荐算法的个性化研究与改进

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:sunyanzi168168168
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
个性化推荐不需要用户主动提供信息,而是通过挖掘用户的历史行为,获取用户的兴趣爱好、习惯、个性等信息,进一步分析判断用户的需求,以个性化的形式主动地向用户推荐符合其个人特性和兴趣偏好的信息。其中协同过滤推荐算法以其没有限定推荐对象类型、无需用户反馈信息等优势脱颖而出,但在基于用户的协同过滤推荐算法中现有的用户间相似度计算方法存在没有考虑用户间差异以及他们自身兴趣信息等问题。而使用单一的基于用户推荐或基于项目推荐对用户和项目之间的潜在关联考虑不够,也会造成推荐算法的个性化效果不佳。本文将上述两个问题作为研究重点,主要的研究工作如下:(1)针对传统基于用户的协同过滤推荐算法中,相似度计算方法对用户自身兴趣考虑不足,从而影响推荐算法结果个性化的缺陷,本文提出了基于用户的UICF算法,通过引入用户兴趣权重衡量用户间相似度,进一步提高推荐结果的精确度和个性化,并使用倒查表进行数据清理。(2)针对仅使用基于用户或基于项目的推荐算法不能有效综合利用用户和项目的关联信息而导致推荐效果的问题,本文采用了混合这两种算法的方式;由于常用的一般系数和平均系数不能很好地结合用户和项目信息,在融合算法时采用了线性系数的方式,保障混合算法的推荐性能。(3)在融合算法时,若采用传统基于用户或基于项目的推荐算法,推荐效果仍然不如人意。本文提出了 ITCF算法,在融合算法时采用双权重因子:在基于用户推荐算法中采用本文提出的UICF算法;在项目相似度计算中引入项目时间权重,以解决时间因素对项目时效性和用户兴趣迁移造成的影响。新算法不仅可以从海量信息中准确把握用户兴趣,在用户或项目某一方面信息较少的情况下也能保证推荐效果。最后在MovieLens数据集中进行实验,通过与传统基于用户的协同过滤推荐算法以及现有文献中算法做对比,验证了 UICF算法的有效性;通过与传统的基于用户的协同过滤推荐算法以及使用均值系数混合算法做对比,证明了 ITCF算法的有效性。
其他文献
牛副流感病毒3型(BPIV3),也称为牛呼吸道病毒3型,属于副粘病毒科呼吸道病毒属。据报道,BPIV3已经成为造成严重经济损失的牛病原,对成年牛和犊牛都具有极强的危害,并且BPIV3与其他的病毒和病原体一起会引起并发症,形成以咳嗽、发烧等为症状的牛呼吸系统疾病(BRDC),成为世界范围内影响牛健康的主要问题。目前,奶业发达国家主要以灭活疫苗或减毒疫苗进行免疫防控,而我国仍然没有相关的疫苗,先前已有
电动潜油螺杆泵具有低能耗,适应性强的特点。但是,大港油田稠油区块在现场应用过程中,经常出现油井产能、螺杆泵和电机选型以及井下运行参数不合理的问题,导致油井的产液能力
氢能作为一种清洁、可再生和环保的能源,将来可以替代传统的化石能源,以满足人类不断增长的能源需求。光催化产氢技术是氢气来源的一种有效方法,高效稳定光催化剂的制备是光
随着对农产品需求的持续增长以及现代信息技术的快速发展,传统劳动密集型农业生产转变为计算智慧型农业业态。智慧农业通过采集农业数据,并对农业数据进行计算与分析,实现农
大多数自然材料满足热胀冷缩的基本物理特性。然而,在卫星、高超声速飞行器、精密仪器仪表等高端装备的服役过程中,结构受到环境温度变化和本身高精度需求,热变形需要实时和
层出镰刀菌(Fusarium proliferatum)是一种重要的植物病原菌,可引起作物重要病害如稻苗枯萎病、茎腐病和穗腐病等。层出镰刀菌在侵染作物的同时也会产生有毒的次生代谢产物如伏
经过近年来综合业务区微格化发展及末端接入业务的爆发式发展,目前的综合业务接入区也因为规划不够精细,没有统一规划数字模型,没有根据家客、集客、政企客户以及宏站室分等业务的覆盖数量,并考虑一级分纤点、二级分纤点、二级分纤点上联纤芯数量、PON分光比、终期实装率等因素,给家客、集客、政企客户以及宏站室分等业务的快速开通造成诸多障碍。接入层光缆纤芯资源已成为通信网络各类接入业务快速开通的一大障碍。所以,我
超支化聚合物是一种具有特殊结构的大分子,在化学、生物、工业等领域被广为所用,因而研究其相关的性质具有重要意义。鉴于Monte Carlo模拟方法在超支化高分子研究中的应用,本文采纳等活性假设并且忽略环化反应,以微分动力学方程为基础,获得了AB_g型超支化高分子均聚体系以及AB_g(10)B_f型二元共聚体系的数量分布函数,进而计算得到体系的高分子矩及数均、重均分子量及多分散指数,并进一步验证了该方
Cox比例风险模型作为生存分析领域中的经典模型,目前已经被广泛地研究并且应用。对于群组性生存数据,为了刻画组内的个体的相关性,通常将经典的Cox模型推广到共享脆弱模型,通
储层描述是一种涉及储层特征定量分布的技术,能够在保证真实地质模型和岩石物性参数的前提下,以较低的成本和风险预测成熟和边缘油田的储量增长。其中岩性识别作为储层描述的一个重要分支,近年来随着测井技术的成熟,正处于快速发展和技术改革的阶段。测井曲线具备垂向分辨率高、采集的数据连续性好和采集方便等优点。因此基于测井曲线资料进行岩性识别是当前一个重要研究课题,其研究有利于指导剩余油的挖掘。根据油田的实际生产