论文部分内容阅读
[摘 要]传统的工作方法在很大程度上限制了图书借阅量和借阅率的提升,因此,要积极改进传统的方式,分析其中的规律。为了更好的为读者服务,相关图书馆工作人员要加强图书推荐和个性化服务方面的工作,准确识别读者的需求和兴趣爱好。基于此,本文对二分网络图书可推荐质量测度方法及个性化图书推荐服务进行分析,以供参考。
[关键词]图书借阅网络;二分网络;个性化推荐
中图分类号:TH491 文献标识码:A 文章编号:1009-914X(2017)36-0164-01
引言
通过对以往数据的总结分析,可以发现,目前图书借阅二元网络在读者进行图书借阅方面具有明显的优势,能够迅速的挖掘读者资源和图书资源。通过结合相应的个性化用户模式表达方法和推荐服务方法,能够充分结合读者的兴趣爱好,实现为读者提供优质的图书信息,在很大程度上提升了图书推荐个性化服务的水平。
1 相关概述
1.1 二分网络概述
二分网路的实质就是一种网络变现形式,是现实生活中诸多网络的一个二分结构。二分网络在构成上包括两种不同类型的节点,其表现形式包含自然和社会中的许多合作网络。由于二分网络具有一定的普遍性,因而在使用范围方面较为广泛,并且对其的应用程度的逐渐增加,已经成为复杂网络研究的重要对象。在已有关于二分网的研究工作中,通常的做法是把二分网投影到单顶点网络,然后进行网络分析。
1.2 个性化服务概述
所谓个性化知识服务,就是借助互联网的功能,结合当前的各种信心资源,参考用户的信息需求,通过对其需求信息的处理,筛选出用户需要的知识信息,再经过收集、整理、分类等流程之后,为用户提供符合要求的服务。个性化服务包括服务时间和空间的个性化、服务方式的个性化、服务内容的个性化。个性化服务方式主要包括个性化定制(推送)、个性化检索与推荐、个性化知识决策,三者智能化程度逐层递增。
1.3 图书借阅网
图书借阅网络实质上是一个实体的网络,在这个网络结构中,可以将读者视为一个节点,将图书作为另一个节点,如果读者借阅此图书,他们之间就可以形成一条连线,这就构成了图书借阅系统的二分网络模型。在对图书借阅网络相关内容进行研究的过程中,部分研究人员发现,该网络体现了很好的单标度性质,即度分布體现为一指数衰减的形式。
2 图书可推荐质量的权值识别方法
2.1 图书可推荐质量的定义
评价一本书的质量是一项十分重要的工作,要综合分析读者的兴趣、理解能力以及图书的特点,并且在评价过程中需要有很强的主动性。所谓图书可推荐质量就是针对同一类型的主题,将特定的图书推荐给读者。相对于图书质量指标而言,具有较高可推荐质量的图书也应该具有专业性较强和撰写质量较高等共同特点;相对于同一类别或者同一主题的其他图书,具有较高可推荐质量的图书更能适合目标读者阅读,并更易于获得读者的满意。与此同时,提供一个良好的推荐客体,结合用户的个性化兴趣特征,最终可以为读者用户提供质量较高的推荐图书。对于特定主题领域,读者自身专业水平的高低决定并且依赖于所借图书可推荐质量的高低。
2.2 算法说明
将读者和图书够共同作为不同的节点,借此构建二分网络,与此同时,图书借阅关系的节点也位于这两个节点中间。由于图书和借阅者之间具有相互决定、相互影响的关系,所以,可以在此基础上构建图书可推荐质量权值计算方法算式,图书的质量权值为借阅读者自身的质量权值和重复借阅次数的乘积之和。经常被读者重复借阅的图书通常更易于受到关注。显然,读者推荐能力权值越高,重复借阅次数越多,对所借图书的可推荐质量权值影响程度就越高。同理可以得到读者推荐能力权值的计算方法。基于此算式可以发现,册数较多的图书通常会拥有更大的借阅量和借阅次数,而读者相对更易于借到册数较多的图书,因此这会影响到仅通过重复借阅次数来判断图书可推荐质量的准确性。同时,利用该分散系数,还可以较好地确保迭代计算值的收敛。显然,一本图书的可推荐质量权值越大,册数越少,则对借阅读者推荐能力权值的影响程度越大。具体算法的步骤说明如下:1)输入,由一组读者及其所有借阅图书组成的借阅记录集合;2)输出,每个读者的推荐能力权值和每本图书的可推荐质量权值。
3 性化推荐方法
1)数据准备:例如,可以将收集的数据按照产生行为的时间进行划分,将其中的几部分作为训练集,剩余的部分作为测试集进行验证,之后对训练集进行准确的计算。对每个顶点的初始概率值进行初始化设置,设置某读者对应顶点的初始访问概率、其他顶点的初始访问概率,最后调用迭代公式计算。2)算法实施:借助随机游走的形式可以得到更好的理论解释,在实际进行概率选择的时候,该算法需要在整个顶点集合上进行一遍迭代游走,由于在时间复杂度方面具有较高的要求,对计算准确程度的要求也较高,因而难以提供充足的时间对读者的阅读变化进行实时计算。为提高服务器计算量,并相对较快取得计算结果,可以采用不同的方案对其优化,然后将结果加权取值。
4 推荐方法的实现
1)特定主题的图书推荐:通常使用的推荐方法包括两种,一种是按照图书的类别尽进行推荐,另一种是按照图书标题中的关键词进行推荐。由于目前部分图书在记录信息方面存在一定的局限性,没有对图书标题信息进行很好的揭示,使得同种类型的图书在推荐时具有明显的宽泛性,用户需要通过关键词和类别互为补充来限定推荐图书的范围。2)现有所借图书的修正型推荐:如果在进行图书推荐的时候,可以结合读者目前所借的图书信息,为其提供质量更高、更符合读者需求的图书,在推荐过程中要确保目前的图书和读者需要的图书在主题、关键字等方面具有较强的相似性。为此,可以将文献的中文标题信息做分词处理,获取所有和当前图书具有较高标题信息相似度并且具有一致类别的图书,利用个性化推荐算法,从中识别出对当前图书的修正型推荐书目名单。
结语
本文提出了基于读者图书借阅二分网络结构的测度图书可推荐质量的方法,并据此对相关的个性化图书推荐服务进行阐述。在实际运行中,要充分结合相关的知识,对如何有效地结合时间信息来进一步提高对用户个性化模式表达的准确度进行深入的研究,为提高图书推荐及服务质量创造更好的条件。
参考文献
[1] 李树青,徐侠,许敏佳.基于读者借阅二分网络的图书可推荐质量测度方法及个性化图书推荐服务[J].中国图书馆学报,2013,03:83-95.
[2] 熊湘云.基于二分网络的多维度推荐技术研究[D].苏州大学,2013.
[3] 周波,杨朝峰.发送者和接受者能力的二分网絡推荐算法研究[J].情报工程,2016,02:71-80.
[关键词]图书借阅网络;二分网络;个性化推荐
中图分类号:TH491 文献标识码:A 文章编号:1009-914X(2017)36-0164-01
引言
通过对以往数据的总结分析,可以发现,目前图书借阅二元网络在读者进行图书借阅方面具有明显的优势,能够迅速的挖掘读者资源和图书资源。通过结合相应的个性化用户模式表达方法和推荐服务方法,能够充分结合读者的兴趣爱好,实现为读者提供优质的图书信息,在很大程度上提升了图书推荐个性化服务的水平。
1 相关概述
1.1 二分网络概述
二分网路的实质就是一种网络变现形式,是现实生活中诸多网络的一个二分结构。二分网络在构成上包括两种不同类型的节点,其表现形式包含自然和社会中的许多合作网络。由于二分网络具有一定的普遍性,因而在使用范围方面较为广泛,并且对其的应用程度的逐渐增加,已经成为复杂网络研究的重要对象。在已有关于二分网的研究工作中,通常的做法是把二分网投影到单顶点网络,然后进行网络分析。
1.2 个性化服务概述
所谓个性化知识服务,就是借助互联网的功能,结合当前的各种信心资源,参考用户的信息需求,通过对其需求信息的处理,筛选出用户需要的知识信息,再经过收集、整理、分类等流程之后,为用户提供符合要求的服务。个性化服务包括服务时间和空间的个性化、服务方式的个性化、服务内容的个性化。个性化服务方式主要包括个性化定制(推送)、个性化检索与推荐、个性化知识决策,三者智能化程度逐层递增。
1.3 图书借阅网
图书借阅网络实质上是一个实体的网络,在这个网络结构中,可以将读者视为一个节点,将图书作为另一个节点,如果读者借阅此图书,他们之间就可以形成一条连线,这就构成了图书借阅系统的二分网络模型。在对图书借阅网络相关内容进行研究的过程中,部分研究人员发现,该网络体现了很好的单标度性质,即度分布體现为一指数衰减的形式。
2 图书可推荐质量的权值识别方法
2.1 图书可推荐质量的定义
评价一本书的质量是一项十分重要的工作,要综合分析读者的兴趣、理解能力以及图书的特点,并且在评价过程中需要有很强的主动性。所谓图书可推荐质量就是针对同一类型的主题,将特定的图书推荐给读者。相对于图书质量指标而言,具有较高可推荐质量的图书也应该具有专业性较强和撰写质量较高等共同特点;相对于同一类别或者同一主题的其他图书,具有较高可推荐质量的图书更能适合目标读者阅读,并更易于获得读者的满意。与此同时,提供一个良好的推荐客体,结合用户的个性化兴趣特征,最终可以为读者用户提供质量较高的推荐图书。对于特定主题领域,读者自身专业水平的高低决定并且依赖于所借图书可推荐质量的高低。
2.2 算法说明
将读者和图书够共同作为不同的节点,借此构建二分网络,与此同时,图书借阅关系的节点也位于这两个节点中间。由于图书和借阅者之间具有相互决定、相互影响的关系,所以,可以在此基础上构建图书可推荐质量权值计算方法算式,图书的质量权值为借阅读者自身的质量权值和重复借阅次数的乘积之和。经常被读者重复借阅的图书通常更易于受到关注。显然,读者推荐能力权值越高,重复借阅次数越多,对所借图书的可推荐质量权值影响程度就越高。同理可以得到读者推荐能力权值的计算方法。基于此算式可以发现,册数较多的图书通常会拥有更大的借阅量和借阅次数,而读者相对更易于借到册数较多的图书,因此这会影响到仅通过重复借阅次数来判断图书可推荐质量的准确性。同时,利用该分散系数,还可以较好地确保迭代计算值的收敛。显然,一本图书的可推荐质量权值越大,册数越少,则对借阅读者推荐能力权值的影响程度越大。具体算法的步骤说明如下:1)输入,由一组读者及其所有借阅图书组成的借阅记录集合;2)输出,每个读者的推荐能力权值和每本图书的可推荐质量权值。
3 性化推荐方法
1)数据准备:例如,可以将收集的数据按照产生行为的时间进行划分,将其中的几部分作为训练集,剩余的部分作为测试集进行验证,之后对训练集进行准确的计算。对每个顶点的初始概率值进行初始化设置,设置某读者对应顶点的初始访问概率、其他顶点的初始访问概率,最后调用迭代公式计算。2)算法实施:借助随机游走的形式可以得到更好的理论解释,在实际进行概率选择的时候,该算法需要在整个顶点集合上进行一遍迭代游走,由于在时间复杂度方面具有较高的要求,对计算准确程度的要求也较高,因而难以提供充足的时间对读者的阅读变化进行实时计算。为提高服务器计算量,并相对较快取得计算结果,可以采用不同的方案对其优化,然后将结果加权取值。
4 推荐方法的实现
1)特定主题的图书推荐:通常使用的推荐方法包括两种,一种是按照图书的类别尽进行推荐,另一种是按照图书标题中的关键词进行推荐。由于目前部分图书在记录信息方面存在一定的局限性,没有对图书标题信息进行很好的揭示,使得同种类型的图书在推荐时具有明显的宽泛性,用户需要通过关键词和类别互为补充来限定推荐图书的范围。2)现有所借图书的修正型推荐:如果在进行图书推荐的时候,可以结合读者目前所借的图书信息,为其提供质量更高、更符合读者需求的图书,在推荐过程中要确保目前的图书和读者需要的图书在主题、关键字等方面具有较强的相似性。为此,可以将文献的中文标题信息做分词处理,获取所有和当前图书具有较高标题信息相似度并且具有一致类别的图书,利用个性化推荐算法,从中识别出对当前图书的修正型推荐书目名单。
结语
本文提出了基于读者图书借阅二分网络结构的测度图书可推荐质量的方法,并据此对相关的个性化图书推荐服务进行阐述。在实际运行中,要充分结合相关的知识,对如何有效地结合时间信息来进一步提高对用户个性化模式表达的准确度进行深入的研究,为提高图书推荐及服务质量创造更好的条件。
参考文献
[1] 李树青,徐侠,许敏佳.基于读者借阅二分网络的图书可推荐质量测度方法及个性化图书推荐服务[J].中国图书馆学报,2013,03:83-95.
[2] 熊湘云.基于二分网络的多维度推荐技术研究[D].苏州大学,2013.
[3] 周波,杨朝峰.发送者和接受者能力的二分网絡推荐算法研究[J].情报工程,2016,02:71-80.