论文部分内容阅读
摘要:本文通过介绍推荐算法的概念入手,根据推荐算法的划分分类,从分类中选择4中推荐算法应用到图书管理系统中进行对比,发现组合推荐技术避免或弥补其他推荐技术的弱点,更适合应用系统中,最后本文总结了4方法的优劣,提供大家更准确的选择推荐算法,形成组合推荐算法。
关键词:推荐算法;图书管理系统;组合推荐
1.推荐算法的概念
推荐算法通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。[1]
2.推荐算法的划分
推荐算法基本可划分基于内容、基于协同、基于关联规则、基于效用、基于知识、组合推荐,下面我们就将基于内容、基于协调、基于关联规则的这三种算法应用到图书管理系统中进行研究分析。
2.1基于内容
基于内容的推荐是在项目的内容信息上建立的推荐应用,并没有考虑用户的需求也就是用户对项目的评价意见,其实它就信息过滤技术的延续和发展,更多地是从内容的特征描述的事例中得到用户的兴趣资料,使用机器学习的方法实现。
在图书管理推荐系统中,基于内容的推荐算法依据项目或对象是由相关特征的属性定义的,系统通过用户评价对象的特征来进行机器学习用户的兴趣,常用的学习方法有决策树、神经网络和基于向量,再对比用户资料与待预测项目的匹配程度。基于内容的用户资料需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化,这一推荐算法能很好的建立用户的喜好模型,但同时对历史数据提出要求,当数据越多用于的喜好模型的准确度就会提高。
2.2基于协同
基于协同过滤的推荐算法推荐采用最近邻技术,在图书管理推荐系统中我们是先通过用户的历史喜好信息来计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,从而根据这一喜好程度来对目标用户进行推荐。[2]这一算法是对推荐对象没有特殊的要求,能处理如音乐、电影等这些非结构化的复杂对象。
基于协同过滤的推荐算法的基本思想非常易于理解就像人和人之间,人们往往会利用好朋友的推荐来进行一些选择,该算法在图书系统中若想要为一用户找到他真正感兴趣的内容的好方法的时候,首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。这一算法是从用户的角度来进行相应推荐的,不需要用户努力地找到适合自己兴趣的推荐信息。
2.3基于关联规则
基于关联规则的推荐是以关联规则为基础,应用在图书管理系统进行推荐时候,采用一种基于关联规则的标签推荐方法,包括以下步骤:步骤1:建立窗口模型采集每个用户所使用过的标签,并添加到标签事务集合,形成标签事务集合T;步骤2:利用最大频繁项挖掘算法对标签事务集合T进行频繁项挖掘,得到频繁共现的标签集集合F;步骤3:对所得频繁共现的标签集集合F进行挖掘找出标签集之间的关系,得到关于所找到标签集之间的关联规则集合R,所述关联规则集合R包括先导标签集及与其关联的后继标签集;步骤4:收集每个待推荐的用户使用过的所有标签,得到关于每个用户的标签集合;判断所述标签关联规则集合R中的先导标签集是否存在于用户的标签集合中,当判断为存在时,將该条规则中先导标签集关联的后继标签集推荐给对应用户。其中,设置标签频繁地同时出现的支持度和置信度;将满足所设置的标签频繁地同时出现的支持度和置信度的标签之间关联及加入关联规则集合R。
2.4组合推荐
基于各种推荐方法的优缺点,在实际中组合推荐便成为人们较为青睐的使用方法,大部分应用研究和应用都是将内容推荐于协同过滤推荐进行组合,形成一个推荐的预测结果。在图书管理系统我们就采取了这样的推荐方式,就是分别用基于内容的方法和协同过滤推荐方法组合形成一个推荐预测结果,然后用协同过滤推荐方法组合形成的推荐预测结果。这个思路是基于研究人员提出的元级别的组合思路完成的。
关于组合推荐的组合方式上,研究人员门得出了一下7种组合思路:
1)加权(Weight):加权多种推荐技术结果。[2]
2)变换(Switch);根据问题背景和实际情况或要求决定变换采用不同的推荐技术。[2]
3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果,为用户提供参考。[2]
4)特征组合(Feature Combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。[2]
5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。[2]
6)特征扩充(Feature Augmentation):将一种技术产生附加的特征信息嵌入另一种推荐技术的特征输入中。[2]
7)元级别(Meta-Ievel):用一种推荐方法产生的模型作为另一种推荐方法的输入。[2]
3.总结
综上所述,将4中推荐算法应用到图书管理系统中我们发现组合推荐就是通过组合来避免或弥补各自推荐技术的弱点,它可以弥补了其他推荐技术的各种问题,达到了我们预设的结果,提高了系统的在推荐技术上的信任度和准确度。因此,本文先给出各个推荐算法的详细对比,让读者可以更准确地有效地去应用组合推荐算法。各个推荐算法的对比如下图所示:
本文将4中推荐算法应用到图书管理系统,并给出了这四种推荐算法的优缺点的详细对比表,方便大家更准确的选择推荐算法,形成组合推荐算法,将组合算法的优势发挥到最大,做到通过组合各种推荐算来避免或者弥补各推荐技术的弱点。
基金项目:
项目编号:B2018400,项目名称:图书推荐系统径向信任传递算法的应用研究,项目类型:2018年湖北省教育厅科学研究计划指导性项目
参考文献:
[1]赵守香,唐胡鑫,熊海涛著.大数据分析与应用:航空工业出版社,2015.12:第182页.
[2]杨旭,汤海京,丁刚毅编著.数据科学导论 第2版:北京理工大学出版社,2017.01:第58页.
(作者单位:武汉晴川学院)
关键词:推荐算法;图书管理系统;组合推荐
1.推荐算法的概念
推荐算法通过一些数学算法,推测出用户可能喜欢的东西,目前应用推荐算法比较好的地方主要是网络。所谓推荐算法就是利用用户的一些行为,通过一些数学算法,推测出用户可能喜欢的东西。[1]
2.推荐算法的划分
推荐算法基本可划分基于内容、基于协同、基于关联规则、基于效用、基于知识、组合推荐,下面我们就将基于内容、基于协调、基于关联规则的这三种算法应用到图书管理系统中进行研究分析。
2.1基于内容
基于内容的推荐是在项目的内容信息上建立的推荐应用,并没有考虑用户的需求也就是用户对项目的评价意见,其实它就信息过滤技术的延续和发展,更多地是从内容的特征描述的事例中得到用户的兴趣资料,使用机器学习的方法实现。
在图书管理推荐系统中,基于内容的推荐算法依据项目或对象是由相关特征的属性定义的,系统通过用户评价对象的特征来进行机器学习用户的兴趣,常用的学习方法有决策树、神经网络和基于向量,再对比用户资料与待预测项目的匹配程度。基于内容的用户资料需要有用户的历史数据,用户资料模型可能随着用户的偏好改变而发生变化,这一推荐算法能很好的建立用户的喜好模型,但同时对历史数据提出要求,当数据越多用于的喜好模型的准确度就会提高。
2.2基于协同
基于协同过滤的推荐算法推荐采用最近邻技术,在图书管理推荐系统中我们是先通过用户的历史喜好信息来计算用户之间的距离,然后利用目标用户的最近邻居用户对商品评价的加权评价值来预测目标用户对特定商品的喜好程度,从而根据这一喜好程度来对目标用户进行推荐。[2]这一算法是对推荐对象没有特殊的要求,能处理如音乐、电影等这些非结构化的复杂对象。
基于协同过滤的推荐算法的基本思想非常易于理解就像人和人之间,人们往往会利用好朋友的推荐来进行一些选择,该算法在图书系统中若想要为一用户找到他真正感兴趣的内容的好方法的时候,首先找到与此用户有相似兴趣的其他用户,然后将他们感兴趣的内容推荐给此用户。这一算法是从用户的角度来进行相应推荐的,不需要用户努力地找到适合自己兴趣的推荐信息。
2.3基于关联规则
基于关联规则的推荐是以关联规则为基础,应用在图书管理系统进行推荐时候,采用一种基于关联规则的标签推荐方法,包括以下步骤:步骤1:建立窗口模型采集每个用户所使用过的标签,并添加到标签事务集合,形成标签事务集合T;步骤2:利用最大频繁项挖掘算法对标签事务集合T进行频繁项挖掘,得到频繁共现的标签集集合F;步骤3:对所得频繁共现的标签集集合F进行挖掘找出标签集之间的关系,得到关于所找到标签集之间的关联规则集合R,所述关联规则集合R包括先导标签集及与其关联的后继标签集;步骤4:收集每个待推荐的用户使用过的所有标签,得到关于每个用户的标签集合;判断所述标签关联规则集合R中的先导标签集是否存在于用户的标签集合中,当判断为存在时,將该条规则中先导标签集关联的后继标签集推荐给对应用户。其中,设置标签频繁地同时出现的支持度和置信度;将满足所设置的标签频繁地同时出现的支持度和置信度的标签之间关联及加入关联规则集合R。
2.4组合推荐
基于各种推荐方法的优缺点,在实际中组合推荐便成为人们较为青睐的使用方法,大部分应用研究和应用都是将内容推荐于协同过滤推荐进行组合,形成一个推荐的预测结果。在图书管理系统我们就采取了这样的推荐方式,就是分别用基于内容的方法和协同过滤推荐方法组合形成一个推荐预测结果,然后用协同过滤推荐方法组合形成的推荐预测结果。这个思路是基于研究人员提出的元级别的组合思路完成的。
关于组合推荐的组合方式上,研究人员门得出了一下7种组合思路:
1)加权(Weight):加权多种推荐技术结果。[2]
2)变换(Switch);根据问题背景和实际情况或要求决定变换采用不同的推荐技术。[2]
3)混合(Mixed):同时采用多种推荐技术给出多种推荐结果,为用户提供参考。[2]
4)特征组合(Feature Combination):组合来自不同推荐数据源的特征被另一种推荐算法所采用。[2]
5)层叠(Cascade):先用一种推荐技术产生一种粗糙的推荐结果,第二种推荐技术在此推荐结果的基础上进一步做出更精确的推荐。[2]
6)特征扩充(Feature Augmentation):将一种技术产生附加的特征信息嵌入另一种推荐技术的特征输入中。[2]
7)元级别(Meta-Ievel):用一种推荐方法产生的模型作为另一种推荐方法的输入。[2]
3.总结
综上所述,将4中推荐算法应用到图书管理系统中我们发现组合推荐就是通过组合来避免或弥补各自推荐技术的弱点,它可以弥补了其他推荐技术的各种问题,达到了我们预设的结果,提高了系统的在推荐技术上的信任度和准确度。因此,本文先给出各个推荐算法的详细对比,让读者可以更准确地有效地去应用组合推荐算法。各个推荐算法的对比如下图所示:
本文将4中推荐算法应用到图书管理系统,并给出了这四种推荐算法的优缺点的详细对比表,方便大家更准确的选择推荐算法,形成组合推荐算法,将组合算法的优势发挥到最大,做到通过组合各种推荐算来避免或者弥补各推荐技术的弱点。
基金项目:
项目编号:B2018400,项目名称:图书推荐系统径向信任传递算法的应用研究,项目类型:2018年湖北省教育厅科学研究计划指导性项目
参考文献:
[1]赵守香,唐胡鑫,熊海涛著.大数据分析与应用:航空工业出版社,2015.12:第182页.
[2]杨旭,汤海京,丁刚毅编著.数据科学导论 第2版:北京理工大学出版社,2017.01:第58页.
(作者单位:武汉晴川学院)