基于协同过滤的数字图书馆个性化推荐技术研究

来源 :中国科学院研究生院中国科学院大学 | 被引量 : 0次 | 上传用户：sherry_yang

【摘要】

：

当前，互联网已经从浏览时代、搜索时代发展到了推荐时代，个性化推荐系统是推荐时代的主要特征。个性化推荐系统有助于解决目前用户所面临的“信息超载”问题。在以信息服务为主

【作者】

：

景民昌

【机构】

：

中国科学院大学

【出处】

：

中国科学院研究生院中国科学院大学

【发表日期】

：

2012年期

【关键词】

：

协同过滤推荐系统用户兴趣度专家信任种子集策略数字图书馆个性化推荐技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

当前，互联网已经从浏览时代、搜索时代发展到了推荐时代，个性化推荐系统是推荐时代的主要特征。个性化推荐系统有助于解决目前用户所面临的“信息超载”问题。在以信息服务为主要业务的数字图书馆领域，推荐系统应用还比较简单，尤其是个性化的推荐服务功能还比较薄弱；同时，随着信息技术的飞速发展、用户信息需求质量的日益提高以及社交网站应用的突起，即使是在电子商务领域，推荐系统的一些固有问题仍然没有得到有效的解决，如数据稀疏性问题、冷启动问题、扩展性问题等都还需要进一步深入研究。　　本文以基于协同过滤的推荐技术为研究主题，从协同过滤的数据源收集、信任推荐算法、新用户冷启动推荐三个方面进行深入研究和探讨，对一些关键技术提出了新的改进思路和算法，并通过实验验证了这些思路和算法的有效性。最后结合数字图书馆的环境特征，提出数字图书馆推荐系统的形式化定义、模型，并利用图书馆丰富的读者借阅数据，实现了一个基于协同过滤的OPAC图书推荐原型系统。　　论文研究的主要成果和创新有：　　 (1)提出一种基于用户信息行为时间进行评分，扩充协同过滤数据源，缓解稀疏性问题的方法。指出可利用用户的多种信息行为(包括显式评分和隐式评分)从数据源上来扩充用户评分数据。以图书馆的OPAC读者借阅历史数据为例，对基于借阅时间评分建立用户兴趣度模型的假设条件、建模方法、评分矩阵转换、数据混合等进行详细探讨。模型将用户的借阅行为划分为不同的类型，每种类型的行为分别有不同的相对借阅时间计算方法，计算得到的用户-项目兴趣数据可作为推荐系统数据输入的有益补充，从而从数据源上缓解协同过滤面临的数据稀疏性问题，同时，模型也为其他具有时间因素的信息行为兴趣度建模提供参考。　　 (2)讨论了从用户评分中计算专家信任度的方法，提出基于专家优先信任和领域专家优先信任的协同过滤推荐算法。对专家信任的概念和模型、从用户评分中计算专家信任度的方法以及基于专家优先信任的推荐算法(EPT)作了详细阐述；同时，在Follow-the-leader模型的基础上，利用项目的分类属性将专家领域化，提出领域专家信任的概念以及基于领域专家优先信任的协同过滤推荐算法(EPT-D)。在实际数据集上的实验结果表明提出的推荐算法评分预测精度、预测成功率上要优于传统的KNN(K-最近邻)方法。　　 (3)提出将项目的关联性属性引入种子集策略的必要性，设计一种基于多属性综合筛选的种子集策略。种子集策略可用于启发新用户评分，缓解协同过滤推荐系统面临的新用户冷启动问题。　　 (4)参考电子商务推荐系统的概念，提出数字图书馆推荐系统(DL-RS)的形式化定义、模型，并实现一个基于协同过滤的OPAC图书推荐系统原型。

其他文献

陈兆祦档案学思想研究

陈兆祦先生是我国现代档案学人的杰出代表,为我国档案界留下了宝贵的思想财富,这些思想丰富了我国档案学的理论体系。本文归纳了先生档案学思想的五个主要方面,并以这五个主

学位

陈兆祦档案学思想发展过程特点意义

贾宝玉的女性崇拜情结与萨满文化的女神世界

读过《红楼梦》的读者应该都有一种感受,贾宝玉对女性的崇拜,简直达到无以复加的地步.rn首先是言语上的推崇,满口所说总是极力贬低男子,抬高女子.如书中借冷子兴之口写道贾宝

期刊

见字如面

“见字如面”,这句信函常用语,现在很少有人用了.如今,给报刊投稿,或编辑来信,只需要在电脑或手机上轻轻一点,便完成了往来操作.有的编辑更简便,干脆来个自动回复,全没了手写

期刊

基于医院信息系统的患者等待时间预测研究

目的:本文旨在利用某儿童医院信息系统中的历史数据，分析门诊就诊流程中影响患者等待时间的因素，在定量分析患者流量与患者等待时间的基础上，找出患者排队的规律。通过建立等待

学位

儿童医院患者等待时间医院信息系统门诊流程回归预测模型

浅谈数学课堂中的情境创设

对于情境而言，好多数学老师并不陌生，多少人知道李吉林的＂情境教育＂在语文教学实践中得到了很好的应用，但没有引起数学教学的应有重视。当今的数学教学特别是小学数学教学中，虽然也

期刊

数学课堂小学数学教学认知活动情境教育育人功能数学教师数学活动教学实践添加剂运用语文游离应用意识融合吉林

Correlative comparison of pedodiversity and land use diversity between case areas from the developed

本文通过对荣华二采区10

期刊

pedodiversityland use diversityShannon entropyconnection indexHenan Province

基于MLDA模型的微博文本主题挖掘

随着互联网的发展和微博的日趋流行，新浪等中文微博网站已成为海量信息的发布平台，然而目前对中文微博的研究大多还是针对单一的用户关系分析，对微博本身内容的挖掘分析研究较少

学位

主题挖掘LDA模型MLDA模型微博文本

技术形态关联分析方法优化研究

未来技术分析在科技规划、科技管理与战略领域发挥了越来越重要的作用，对于情报研究而言，除了在拥有良好基础的动态监测和态势分析的基础上，还应在技术创新领域开展更多的面向未

学位

技术形态分析3D显示特征词选择因子分析关联矩阵

乡镇公务员信息行为研究——以河北省为例

近些年对信息行为的相关研究无论从深度上还是广度上都已经有所成就，借鉴心理学、社会学及人类学等相关学科的基础理论方法形成了很多理论体系，一部分是基于认知的信息行为研究

学位

乡镇公务员合作信息行为行政体制

本研究以新生代农民工为研究对象，通过对昆明市新生代农民工的信息行为进行长期的实地调查、理论分析和实证研究，把握新生代农民工的信息行为特征、规律，对新生代农民工择业过程

学位

新生代农民工择业过程信息行为获取渠道知识需求

基于协同过滤的数字图书馆个性化推荐技术研究

与本文相关的学术论文