基于Web日志分析的数字图书馆个性化推送服务研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:lincl008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网信息技术的飞速发展,数字图书馆的数字化文献资源与日俱增,用户从数字图书馆获取有效需求信息的难度也逐年上升。如何帮助用户方便、快捷、准确的获取所需信息资源是数字图书馆的重要研究方向。  数字图书馆的个性化推送服务将获取到的用户需求与馆藏文献资源进行匹配,选出与用户需求相符的信息资源并主动推送给用户,满足了用户的个性化需求,提高了用户获取资源的效率。  论文首先研究了个性化推送服务的流程及 Web日志分析的相关技术和算法,包括独立用户识别技术、网页抓取技术、中文分词技术、特征加权算法、中文文本分类算法等。然后提出了基于Web日志分析的数字图书馆个性化推送服务模式,通过对用户的行为日志进行处理、分析,提取用户的兴趣特征,匹配相关的文献资源并推送到用户的电子邮箱中。分析和构建了推送服务架构,对该架构的日志文件预处理、用户行为特征分析、文献资源特征分析、信息推送、数据实时更新等五个模块进行设计,其中着重研究和设计了用户行为特征分析模块,通过jsoup技术抓取用户访问的资源页面,运用NLPIR汉语分词系统对页面文本进行中文分词并基于 TF-IDF算法计算各特征词的权重,利用朴素贝叶斯分类算法将该页面进行文本分类,得到用户的兴趣特征数据。最后,对个性化推送服务架构进行实例验证,并与传统的基于规则的文本分类方法进行对比实验,证实了该架构的可行性。
其他文献
从健康第一观点出发 ,对华侨大学俱乐部制选课提出新的思考和新的要求 From the first point of view of health, new thinking and new requirements are put forward for
企业档案已经越来越受到企业管理者的重视,他们逐渐认识到管理好企业档案对提高企业的经济效益、提升企业的竞争力大有益处,因此,企业档案的管理已经成为企业各项管理工作中不可
期刊
各有关单位和个人:由国家体育总局体育文化发展中心主办的2014年全民健身优秀论文报告会将于11月下旬在安徽芜湖召开。会议征文突出理论密切联系体育实际,侧重录用从体育文化、
期刊
小组合作学习是新课程倡导的新的学习方式之一,在合作学习热潮的背后,由于对小组合作学习的理解和操作存在多种偏差,致使小组合作学习的有效性不高。本文就高中生物教学中所采取
随着电子政务的全面开展,我国政府各部门和各级地方政府都建立起了政府门户网站,它已成为了衡量公共行政改革成功与否的重要标志之一。如今我国政府提出了建设“服务型”政府的
钱存训先生是享誉世界的图书馆学家、图书馆事业家和图书馆学教育家。他毕生从事图书馆工作及图书馆学术研究,著述丰富,建树良多。研究钱存训先生的图书馆学思想及其实践,对了解
在知识经济时代,培训与发展成为了机构获取持续竞争优势的人力资源保障。培训需求分析是培训活动的第一步,在培训中发挥着基础性、指导性的作用,直接决定了培训的成败。然而,目前
期刊