基于多相似性测度优化的个性化推荐方法研究

来源 :天津商业大学 | 被引量 : 0次 | 上传用户:seryanny
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的快速发展,使得信息呈现指数型增长,在丰富人们知识信息的同时,也带来着信息过载的问题。在此背景下,推荐系统应运而生。个性化推荐是通过对用户历史行为信息进行学习,来构建用户的兴趣偏好,从而主动的推荐给用户感兴趣的信息。协同过滤推荐技术凭借着简单易构建、可解释性好等特点,成为目前推荐系统较为成熟且应用较为广泛的推荐技术。协同过滤推荐近年来在研究领域获得很大的进步,应用也越来越广泛,但仍存在着相似度计算对用户评分差异不敏感、综合相似度计算中权重系数的确定较为粗糙、近邻选择不够精准等问题,这些都对推荐系统的预测准确性造成很大的影响。本文在总结和分析现有推荐算法的基础上,以相似度计算为出发点,提出一种基于多相似性测度优化的个性化推荐方法,在评分相似度计算、综合相似度权重确定、近邻选择三方面对推荐过程进行优化,提升推荐结果的准确性,所做主要工作如下:(1)针对传统相似度计算对用户评分差异不敏感问题,通过引入信息熵概念,利用信息熵能够度量数据混乱程度的特性,来构建用户特征相似度。而对于引入信息熵计算相似度带来差异性抵消、未考虑共有项目占比的问题,对原有计算公式进行修正,首先用实际差值对信息熵公式加权,其次在归一化后利用Jaccard相似度进行修正,得到本文定义的用户特征相似度。用户特征相似度度量用户评分向量的差异对用户相似的影响,即用户评分差异大,则用户相似程度低。(2)融合用户评分相似度和用户特征相似度构建综合相似度,其中用户评分相似度是利用SVD++方法对评分矩阵进行填充后计算Pearson相似度得到。两相似度的加权中,利用粒子群优化算法确定两种相似度权重比例,以RMSE值为目标函数,权重系数为粒子,确定精细程度更高的权重系数,从而得到更为精准的综合相似度。(3)针对近邻选择不够精准问题,提出了一种兼顾评分相似度和兴趣相似度的二次筛选近邻集的方法。首先借助项目的属性信息来构建用户-类别兴趣矩阵,其次利用TF-IDF的思想计算用户的兴趣偏好向量,进而计算向量间相似度得到用户兴趣相似度。二次筛选中,首先设置兴趣相似度阈值获得候选近邻集,再通过综合相似度二次筛选得到更优近邻集。在数据集上进行仿真实验,首先设置本文定义的用户特征相似度与传统相似度在协同过滤推荐算法的对比实验,以验证本文优化相似度计算方法的有效性,其次设置本文算法与其他算法模型的对比实验,以验证本文所提出算法的有效性。从最终的实验结果可以看出,本文算法在推荐系统覆盖率保持稳定的基础上,推荐系统评分预测准确性有所提升。
其他文献
随着非线性混沌理论描述现实经济现象的广泛应用,学者们认为非线性经济动态分析要优于均衡动态分析。因此经济活动的非线性相互作用在经济建模中得到重视,通过充分利用非线性动力学的混沌理论与方法,对经济系统的动态行为进行分析,非线性经济学由此得到发展。对于某一经济系统而言,稳定性可作为判断其优劣的标准之一。然而在经济领域中,当系统处于不稳定状态时,可能会导致混沌发生,这对多数系统而言是有害的。因此,如何控制
学位
蚁群算法在配电网故障区段定位中应用效果良好,但具有搜索时间长、计算速度慢等缺点,为此对蚁群算法进行了改进。首先构造了动态适应配电网拓扑结构的开关函数,其次提出了蚁群信息素初值设置方法,引入解的扰动规则,最后确定了蚁群算法应用于多电源条件下配电网故障区段定位的方法。算例结果验证了该算法在计算速度和容错性方面的优势。
期刊
麦肯锡讲过:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”数据信息是否完备和充足直接关系到行业及业务的发展,可靠、准确、完整的数据能够提供准确、及时和系统的统计分析与决策,反之,数据的不完整或缺失会降低统计分析与决策的准确性,影响行业和产业发展,甚至会造成巨大的经济和社会损失。然而,在生产实践中,由于某些主、客观原因,不可避免的会造成一些数据缺失,影响数据的质量。对于缺失数
学位
在研究股票市场的波动情况时,除了综合分析影响股市的相关金融数据外,还可以借助于股评短文本数据加以考量。然而,由于受情感分析技术的限制,目前对股评文本数据分析主要是基于手工标注情感极性基础上再进行股市波动预测,存在时间长、成本高、利用股票实际数据不充分等方面的问题。基于此,本文提出了一种将股票历史数据与股评文本数据有机融合,通过建立股票涨跌“五极”情感分析模型与“专家”权重函数模型,对个股涨跌趋势进
学位
近年来,随着大数据时代的到来和人工智能的兴起,机器学习逐渐应用到各个学科与领域。神经网络作为机器学习和人工智能技术的基础,得到了广泛的关注与应用。神经网络作为一种黑箱算法,虽然在预测与分类等方面有着优异的表现,且具有良好的自适应性、鲁棒性以及灵活性等优势,但也存在模型的可解释性不强、缺乏对预测结果的可信性分析、无法对预测的不确定性进行度量等问题。近些年来,众多学者开始探索将统计学理论与机器学习方法
学位
缓粘结预应力体系是以无粘结和有粘结预应力体系为基础研发出来的一种新型预应力体系,该技术省去了有粘结预应力体系的预留孔道和灌浆工序,克服了无粘结预应力体系与混凝土无粘结的缺点,以及后期锚具容易疲劳失效的问题,具有良好的力学性能,在国内外众多工程中得到了应用。国内外学者对于缓粘结预应力技术进行了许多研究,但关于缓粘结预应力筋的粘结性能及其影响因素没有系统的研究,相关的有限元分析也相对较少,这一定程度上
学位
胚胎种植是体外受精-胚胎移植(IVF-ET)助孕过程中的关键环节,胚胎着床的成功不仅需要有良好发育潜能的胚胎,还必须具备子宫内膜同步发育。而对于反复胚胎种植失败(RIF)患者,优质的胚胎极为重要,而临床更加关注子宫内膜容受性的影响。子宫内膜蠕动是内膜容受性的重要影响因素之一。若能在胚胎移植前后使用药物抑制子宫收缩,更利于胚胎的着床。而作为宫缩抑制剂的一种,阿托西班的安全性和有效性均较高,不仅可使子
期刊
随着战场上载荷烈度的增加以及作战方式的变化,作战装置在战场环境下会发生严重的变形和破坏,威胁军队战斗力以及作战人员的安全。为了提高装置的抗爆性能,对三明治结构优化设计的研究成为爆炸防护领域中需要关注的热点问题之一。作为一种新型材料,碳纤维金属层合板在爆炸防护领域中具有广泛的应用前景。然而结构在爆炸载荷作用下,爆炸冲击波在结构中的传播是敏感于面板的叠层结构以及夹芯的几何构型的。如何合理地进行纤维金属
学位
有限的营运资金是中小企业在经营决策中的一个常见制约因素,资金约束企业主要有两种广泛使用的融资模式:银行信贷融资和贸易信贷融资。近年来,随着电子商务的快速发展,电商平台融资成为了贸易信贷融资的一种新形式。然而,当前关于电商平台融资的研究都是基于企业决策者完全理性的假设,对于非理性心理的研究很少。市场需求的不确定性导致决策者表现出明显的损失厌恶偏好。因此,研究损失厌恶偏好下的供应链融资问题具有重要意义
学位
随着互联网的迅速发展,“信息过载”问题也日益严重,推荐系统作为解决信息过载问题的重要工具,在未来互联网的发展中扮演着引擎的作用。推荐算法的设计问题是推荐系统最为核心的部分。目前,应用最为广泛的协同过滤推荐算法在推荐系统领域取得了显著的效果。但是,在面对数据稀疏问题、用户兴趣随时间的迁移问题、项目特征模糊性和用户兴趣模糊性问题时仍有不足之处。本文提出了一种基于项目特征模糊性与用户兴趣偏好性的推荐算法
学位