基于Web日志挖掘在个性化推荐中的应用研究

被引量 : 4次 | 上传用户：cjjelly

【摘要】

：

随着Internet的飞速发展，网络越来越渗透到人们日常生活当中，移动网络、社交网络、物联网以及微博等一些新型的网络产品，正在改变着人们传统的接受信息的方式。同时，网络数据量也

【作者】

：

赵传超

【发表日期】

：

2013年01期

【关键词】

：

数据挖掘 Web日志挖掘 Apriori算法个性化推荐

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着Internet的飞速发展，网络越来越渗透到人们日常生活当中，移动网络、社交网络、物联网以及微博等一些新型的网络产品，正在改变着人们传统的接受信息的方式。同时，网络数据量也呈现前所未有的爆炸式增长，人们已经进人了大数据时代，面对如此海量的数据，人们如何有效获取需要的信息便成为迫切需要解决的问题。因此，个性化服务技术越来越受到了广泛的重视。Web服务器日志文件中记录了用户的上网时间、焦点窗口运行的程序、页面访问等信息，通过对这些过程信息进行关联规则或决策树建模分析，可以客观的反应用户的软件使用和网页访问模式的偏好以及软件或网页内部之间的关联关系，对用户进行软件和网页推荐，还可以对具有相似行为的用户进行划分，通过聚类得到类群，从而有针对性的向具有某些相似属性的用户推荐合适的朋友。通过这些方法可以给一些站点或软件提供商在站点结构改进、软件个性化推荐、交友推荐以及电子商务中发现潜在客户提供决策参考。本文基于Web日志数据挖掘的个性化软件推荐和好友推荐的研究。论文首先阐述了研究的背景意义以及个性化服务研究现状和面临的问题；其次系统介绍了数据挖掘的概念、过程以及论文中所用到的数据挖掘算法，并在算法的理论基础之上提出了Apriori算法的改进方法；最后采用Spss Clementine数据挖掘工具对清理好的日志数据进行建模分析，得出了基于焦点窗口的浏览器市场占有率的结果，并建立了软件个性化推荐的关联规则和决策树模型，在最后提出了一种基于用户属性信息和软件使用偏好的好友推荐方案。论文创新点的主要体现在以下几个方面：(1)重点分析关联规则中Apriori算法，并针对当前Apriori算法在每次生成频繁集后，又重新扫描数据库来判断候选频繁项集是否为频繁项集的不足，提出了改进，通过引入质数分解法实现了生成频繁项集时只扫描一次数据库，提高算法的效率。(2)提出了基于用户焦点窗户的浏览器市场占有率分析的方法，真实的反应了用户使用浏览器的情况，并对5-7月份浏览器浏览器市场占有率变化进行分析对比。(3)在研究Web数据挖掘技术优势的基础上，采用Spass Clementine数据挖掘工具对清洗好的数据集进行建立模型，发现软件之间内在的关联模式并根据用户属性针对性的进行软件推荐，为360软件管家等软件的个性化推荐服务提供了理论基础。(4)针对现存推荐系统存在的不足，提出了基于用户属性和软件使用偏好对用户进行好友推荐的算法设计方案。该方案借助K-Means聚类算法和余弦相似度计算出用户包含属性相似和软件使用偏好相似的最终相似性，通过相似性可以实现具有相似行为和属性的好友推荐。

其他文献

养生大穴数神阙

<正>"脐"中大有奥妙肚脐被称为"神阙穴","神者,变化之极也。故名之以‘神’,‘阙’为‘宫阙’之意,以示尊贵,人身以神志为最贵,此穴为元神居住的地方,心肾(心藏神,肾藏志,实

期刊

神阙穴

区域多港口合作竞争策略及其利润分配机制

为有效分析区域多港口之间的合作竞争策略,根据港口服务价格、服务时间以及港口之间的影响,提出港口需求的函数表达式,并在此基础上考虑港口服务时间可靠性约束,提出港口合作

期刊

港口合作竞争时间价格

苏州乡村旅游发展中的问题与对策研究

随着工业化还有城市化进程加快以及由此带来的负面影响,城市居民就会向往宁静的田园生活还有美好的乡间环境,乡村旅游在这样的背景下产生了。乡村旅游,是以农业文化景观、农

学位

乡村旅游苏州旺山生态园问题

浅谈新媒体发展时期新闻的全新特点

世界工业革命的发展,使传媒工具不断更新,从报纸杂志到广播电视,再到如今的互联网,这些科技改变了媒介,也改变了整个传媒活动。如正在进行的第三次工业革命,将媒体力量以传统

期刊

新媒体新闻新闻特点

血小板平均体积及分布宽度与冠心病危险因素的关系

目的：急性冠脉综合征（Acute Coronary Syndrome，ACS）是指不稳定斑块破裂，血小板于内皮损伤处粘附、聚集并导致不同程度的血栓形成的过程。其中血小板活化是该病理过程的核心环节。

学位

血小板平均血小板体积血小板分布宽度冠心病危险因素

黑格尔艺术认识范畴与艺术情感研究

在黑格尔哲学体系中,关于艺术哲学中艺术想象的发展与实践,对于理性思维的实践意义重大。黑格尔认识范畴实践内涵来源于艺术主体的意志立法,通过作为一个绝对理性的角色以艺

期刊

黑格尔艺术认识艺术情感

心导管术后造影剂神经毒性：病例报道和112例病例综合分析

我们报道了一名72岁的男性患者,接受经皮冠状动脉介入治疗(PCI)处理右冠状动脉慢性闭塞病变(CTO),术中注入非离子型低渗性造影剂碘帕醇。术后患者出现头痛、意识下降、激惹和

学位

造影剂神经毒性心导管术碘造影剂一过性皮质盲高血压

高F值寡肽抗疲劳作用的研究及其饮料的开发

本研究通过复合酶可控水解玉米蛋白粉制得高F值寡肽（F值为21．7）,对其抗疲劳功能进行评价,并开发了功能性饮料。结果表明,实验组与对照组相比,高、中剂量组游泳时间分别提高了54%

期刊

玉米蛋白粉高F值寡肽抗疲劳功能评价饮料

现代有轨电车中压网络接线方案

对现代有轨电车的负荷特点进行分析和研究,在明确外部电源供电方式的基础上,对现代有轨电车供电负荷等级的划分提出建议,同时提出4种中压网络接线方案,即双回路10 k V电源直

期刊

现代有轨电车供电系统外部电源中压网络接线方案

野山药能改善阿尔茨海默氏症

<正>日本富山大学一个研究小组日前宣布,他们发现野山药(学名日本薯蓣)成分"薯蓣皂甙元"具有改善阿尔茨海默氏症的作用。野山药为多年生缠绕草质藤本,喜生于向阳山坡、灌木丛

期刊

阿尔茨海默氏症野山药

基于Web日志挖掘在个性化推荐中的应用研究

与本文相关的学术论文