基于关联规则的Web使用挖掘

来源 :对外经济贸易大学 | 被引量 : 0次 | 上传用户:qq20881010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量的数据中提取隐含的、未知的、具有潜在价值的有用信息。Web使用挖掘就是运用数据挖掘的思想来对Web服务器日志进行分析处理。Web使用挖掘在电子商务和Web个性化等方面有着广泛的应用。通过挖掘Web使用挖掘可以改善网站的组织结构,监控服务器的工作情况,改善Web应用的系统设计,为用户提供个性化服务。   数据挖掘主要的算法有分类模式、关联规则、决策树、序列模式、聚类模式、神经网络等等。关联规则是数据挖掘领域中一个非常重要的研究课题,Apriori算法是关联规则最经典的算法。   数据预处理是数据挖掘非常关键的环节,其好坏直接影响到后续工作是否能得到理想的结果,同时也决定了最终挖掘出的知识的可信度。Web使用挖掘数据预处理包括四个步骤:数据清理、用户识别、会话识别、路径补全。   本文研究了Web使用挖掘的特点、方法和相关技术,讨论了数据预处理的过程和有效的数据预处理方法。运用Apriori算法、Clementine数据挖掘工具对中俄经贸合作网Web使用日志进行挖掘,详细给出Web使用日志数据预处理的方法、对挖掘结果进行分析。
其他文献
从2006年开始,我国寿险业第二张经验生命表正式启用,而已经使用尽十年的第一张经验生命表由于已不符合我国现阶段人口生存状况而被取代。新旧生命表在许多方面存在差异,本文鉴于
在全球化的经济背景下,中小企业在国民经济的地位不断提高,同时,中小制造企业为我国的出口所做的贡献也在逐年递增,中小企业的国际化已经是全球经济的发展趋势。然而,中小企
银行保险在目前市场看来就是保险公司与银行、邮政和其他金融机构实施相互渗透和融合的战略,并通过资产的连接、客户资源的整合与销售渠道的共享,提供银行保险产品及服务的一种
近年来,自然界中的极端事件时有发生.例如,2004年的印度洋海啸,2005年的Katrina飓风,2008年的汶川大地震,2010年的海地地震,2010年的智利地震,2015年的美国洪水等.这些极端事件往往会给保险公司带来巨额理赔.虽然它们发生的概率很小,但往往只要发生就会给保险公司带来非常大的冲击,甚至导致公司破产.历史数据表明,经典的轻尾分布用于刻画这种极端理赔存在着明显的偏差.应用概率学者研
学位