基于Web日志挖掘的个性化推荐原型系统研究与实现

来源 :南京农业大学 | 被引量 : 0次 | 上传用户:shaoyuqi521
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的迅猛发展把我们带进了一个信息爆炸的时代,海量信息使用户很难从中发现自己感兴趣的部分,容易导致信息过载和资源迷向,这使针对用户的个人特定需求而为其提供针对性服务的个性化推荐系统应运而生,将用户可能感兴趣的信息传送或优先传送给用户。为了在更深的层次上理解用户的行为,而不需要用户的参与,需要用到Web日志挖掘,Web日志记录了用户的访问行为。通过Web日志挖掘,比较用户间的访问相似度,找出相似用户组,可以主动地向用户推荐相似用户组访问过而用户本身还没有访问过的网页。基于Web日志挖掘的个性化信息推荐日益成为一个重要的研究课题。本文主要介绍了国内外个性化推荐技术的现状,提出了个性化推荐技术需要改进之处。阐述了Web日志挖掘的概念和步骤,描述了个性化推荐的概念、分类、核心技术和步骤。分别对基于Web日志挖掘的个性化推荐算法进行中的个性化浏览推荐算法和个性化搜索推荐算法进行了介绍和改进,通过分析Web日志记录的用户的行为特征,对基于向量聚类算法提出了改进的思路,提出基于共同点击网页的用户聚类算法,增加了用户聚类和推荐的准确性,还提出了基于当前点击页的推荐算法,并且通过对查询关键词扩充算法的研究,提出了基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化搜索推荐排序算法。并将这些算法引入到一个基于Web日志的个性化推荐(包括个性化搜索)原型系统中并给予实现,通过这种界面形式向用户推荐其可能感兴趣的但又未浏览过的网页,并给出了该系统的详细模块设计和功能介绍,对系统的功能进行了测试和评价,证明了算法的准确性。最后总结了本文工作中存在的问题,提出了今后的工作。其中基于共同点击网页的用户聚类算法、基于用户兴趣度的结果扩展查询算法和基于用户相似度的个性化排序方法是本文及本系统的难点与创新点总之,本文全面系统地总结了目前国内外个性化推荐技术的现状,为系统的个性化推荐功能提供了很好的借鉴。同时,本文中采用的基于Web日志挖掘的个性化推荐算法,经测试结果证明,具有较高的查准率,有一定的实用价值。
其他文献
<正>《社戏》是鲁迅先生的经典名篇,是鲁迅作品中少见的充满温情的文章,给人们展示了一段充满快乐和童趣的江南水乡生活。本文构思巧妙绝伦,语言艺术高超精湛,描写手法生动细
目的探讨两种不同手术方法治疗伴有白内障的急性闭角性青光眼的临床效果。方法选取56例56眼伴有白内障的急性闭角型青光眼患者,随机分A、B两组每组28例28眼,A组行单纯小梁切
回顾了三峡工程的历史沿革和不同时期的功能定位。具体分析了三峡工程对生态环境的有利影响,即以防洪为三峡工程的第一目标去理解,它是一项重大的生态修复工程;同时也分析了
随着当前全球化的不断推进与完善,公司治理模式的也在呈现多元化的发展。当前我国企业要适应市场经济体制的不断变化,进一步增强公有制经济的活力,就需要坚持国有资本、集体
锡盟草原的退化对生态环境的影响越来越大,也越来越受到人们的关注。文章针对锡盟草原生态系统的退化现状,从气候和人为因素两方面分析了锡盟草原生态系统退化原因,提出了退
门源回族自治县位于中国青海省东北部,属海北藏族自治州管辖,在海北藏族自治州东部,东部和北部与甘肃省相邻。距省会西宁150公里,距海北州州府驻地海晏县250公里。总面积6896
目的:观察21例复发性喉乳头状瘤患者采取低温等离子射频术的控制效果。方法:选取2012年1月-2016年10月进行喉乳头状瘤治疗的21例患者为研究对象,使用低温等离子射频术进行治
论述了利用标签管理互联网媒体信息安全系统—内容安全分级管理系统的原理与组成,对其中的执行监管职能的模块进行了详细的描述,并给出其基于多协议代理的实现架构。
通过市场营销环境分析和SWOT分析,对绿源电动车进行了一系列的营销策划方案:将目标市场细分为中低端用户、高端用户、特殊客户三类;市场定位主要在中低端消费群体,争取高端市
贝类产品的市场流通在我国贝类产业经济中具有重要意义。为研究其上市和流通特征,本文根据在青岛市城阳水产品批发市场走访调研的一手资料,从运营现状、管理状况、上市特征、