基于Web日志挖掘的个性化推荐研究

被引量 : 0次 | 上传用户：tnngx123

【摘要】

：

随着Internet应用的迅速发展,网上信息迅速增长,信息种类也越来越多,人们面对太多的信息无法选择和消化,此种现象称为信息过载。Internet上信息资源分布的广泛性又给用户寻找

【作者】

：

张海鹏

【发表日期】

：

2007年期

【关键词】

：

Web日志挖掘个性化推荐数据预处理兴趣度兴趣聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet应用的迅速发展,网上信息迅速增长,信息种类也越来越多,人们面对太多的信息无法选择和消化,此种现象称为信息过载。Internet上信息资源分布的广泛性又给用户寻找感兴趣的信息增加了困难,也就是所谓的信息迷失。当前主要采用搜索引擎来检索Web上的信息,大多数搜索引擎缺乏主动性,未考虑个体用户的兴趣偏好,因而未能有效地解决信息过载和信息迷失的问题。为了有效地解决信息过载和信息迷失给人们带来的种种困扰。最近研究者们提出了一种被认为能有效解决这些问题的技术-Web个性化服务技术。Web日志挖掘是将数据挖掘技术作用于Web服务器日志文件等获得有关用户访问行为的知识。这些知识可以服务于Web站点的服务提供方和访问者,进而改进Web站点设计以方便用户使用,提高Web服务器的性能,增加个性化服务等。基于Web日志挖掘的个性化服务是目前Web个性化服务中应用和研究的关键技术,主要是利用Web日志挖掘的相关技术为不同的用户采取不同的服务策略,提供不同的服务内容,开展个性化服务。本论文在较为系统地分析Web日志挖掘中数据处理方法的基础上,针对用户访问兴趣度表示的不足,提出一种基于用户浏览时间和浏览页面关键字的度量方法,能较好的表示用户访问兴趣。提出基于兴趣聚类的个性化网页推荐方法。对比K-path聚类,兴趣聚类提出了更有效的路径相似度函数,采用了竞争凝聚思想,能够自动确定最佳的聚类数目。并对推荐算法中的相似度函数进行改进;利用关联规则发现得到页面推荐集,设计一个基于该算法的个性化推荐系统模型。通过实验表明本文的预处理算法可以很好的识别用户的访问情况,兴趣聚类算法在时间复杂度上优于K-path算法,改进的推荐算法可以提高推荐正确率,推荐准确率在87%左右,具有较高的准确性。本文的主要研究内容如下:①Web日志挖掘中数据预处理方法的研究。详细研究和探讨了Web日志挖掘中数据预处理的整个过程及方法。包括:数据清洗、用户识别、会话识别、路径填充、事务识别等。②对用户访问兴趣的表示和度量进行了研究。分析了已有的度量用户访问兴趣方式的不足之处。提出一种基于用户浏览时间和浏览页面关键字的度量方法。③提出了一种基于用户访问兴趣的聚类算法(CCCA),并针对以往推荐方法的不足进行相应的改进。首先针对K-paths聚类算法的不足,提出更有效的路径相似度函数,采用竞争聚类思想,能够自动确定最佳的聚类数目。对推荐算法中的相似度函数进行改进,采用关联规则发现得到页面推荐集。④提出基于兴趣聚类的个性化推荐系统模型。系统分为离线和在线两个模块,能够为用户提供实时的个性化服务。⑤通过实验验证论文中日志数据预处理方法的正确性,兴趣聚类和个性化推荐方法优于改进前的方法。最后,对所做的工作进行了归纳于总结,展望将来进一步的研究工作。

其他文献

韩剧热播对中国青少年的影响探析

进入新世纪以来,“韩流”就以更加不可阻挡的态势汹涌而至。追逐“韩流”的主体以14~18岁的中学生为核心,以19~30岁的大学生和社会青年为外延。作为“韩流”重要组成部分的韩

期刊

韩剧青少年影响启示

大学毕业生“雇主满意度”研究

近年来,在大学毕业生就业难的社会背景下,引发了人们对高等教育质量应该由谁来评价问题的思考。企业雇主是高校毕业生的接收者和使用者,雇主们对高校毕业生的评价是高校办学

学位

雇主满意度大学毕业生综合素质

大学行政管理的科层制逻辑研究

随着社会经济的发展和高等教育的发展进步,大学进入了一个改革发展的关键时期,与此同时大学行政管理体制改革也渐渐成为学术界关注的重点课题之一。行政管理工作对大学的发展

学位

行政管理科层制科层制逻辑

大学生社会主义核心价值观践行研究

党的十八大以来,中央高度重视培育和践行社会主义核心价值观。培育和践行社会主义核心价值观,是推进中国特色社会主义伟大事业、实现中华民族伟大复兴中国梦的战略任务。当代

学位

社会主义核心价值观大学生践行研究

双校区运行交通成本优化研究

在我国高等教育不断扩大招生规模的基础上,为满足教学资源的要求,高校不得不开始扩建或新建校区。为保证多校区之间的正常运行,交通管理是我们不可回避的问题。如何降低交通

学位

重庆交通大学双校区办学交通成本

大学生思想政治理论课实践教学研究

大学生思想政治理论课实践教学是思想政治理论课的重要组成部分,是提高大学生实践参与能力、认识社会能力的重要手段,是理论联系实际原则在高等教育领域的重要体现。在时代飞

学位

大学生思想政治理论课实践教学

单向通信汽车轮胎压力监测系统设计及实现技术研究

轮胎气压是影响汽车性能和行驶安全的重要因素。在汽车高速行驶的过程中,轮胎压力异常极易导致爆胎,可能引发安全事故。轮胎压力监测系统(TPMS)能对轮胎的气压和温度进行实时

学位

TPMS轮胎模块监视器模块无线数据通信

催眠疗法治疗焦虑症临床疗效研究

目的　观察催眠疗法治疗焦虑症的疗效。方法　将病人随机分成两组 ,实验组采用每周 2次催眠治疗(言语性催眠 ) ,对照组口服抗焦虑剂阿普唑仑。在治疗前及治疗后 2周、 4周分

期刊

催眠疗法阿普唑仑焦虑症

大理地区高血压患病率调查及影响因素分析

目的探讨大理地区高血压的患病率及影响因素。方法对大理地区≥17岁的1 843名居民进行高血压患病率及影响因素的调查。结果大理地区≥17岁居民中高血压的患病率为32.4%,其

期刊

高血压患病率影响因素人群研究

复方聚乙二醇和硫酸镁行肠道准备的有效性和安全性Meta分析

目的系统评价复方聚乙二醇和硫酸镁在结肠镜检查前行肠道准备的有效性和安全性。方法检索中国数字医院图书馆全文数据库和中文科技期刊全文数据库,检索主题词为"肠道准备"或"

期刊

复方聚乙二醇硫酸镁结肠镜检查Meta分析

基于Web日志挖掘的个性化推荐研究

与本文相关的学术论文