Web使用挖掘的理论与方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:missiyoumiss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究了聚类和关联规则等与Web使用挖掘有关的理论和技术基础,提出了Web使用挖掘的系统框架,阐明了从Web数据预处理、Web用户访问路径模式发现、Web聚类分析和特征规则挖掘等方面开展对Web数据进行使用挖掘的研究思路.在Web使用挖掘的数据准备方面,系统地研究了Web数据预处理的数据清理、用户识别、会话识别、路径补充和事务识别等过程,设计了有关算法,并实现了Web数据预处理的自动化系统,同时用实际Web网站服务器中的日志数据加以验证.在Web用户访问路径模式发现方面,研究了用户访问模式挖掘的理论和方法.在分析基于偏爱度的用户访问路径挖掘模式的基础上,提出了基于页面层次和喜爱度的用户浏览频繁路径获取方法,并实现了原型系统,阐明了全面考虑支持度、用户浏览时间和页面层次三种因素的用户浏览频繁路径发现技术.在Web聚类方面,系统地研究了度量聚类对象相似度的方法,并根据Web特点,研究了基于页面间链接距离的页面聚类方法.在Web用户聚类方面,探索了一种基于矩阵变换的Web用户聚类方法,系统地考虑聚类对象之间的相互作用和影响.现有的Web关联规则挖掘主要考虑对用户访问页面的支持度和信任度.本论文结合Web使用挖掘的特点,研究了带有时间戳的Web关联规则挖掘方法,并研制了相应的原型系统.论文还研究了从用户网站登录信息中挖掘出与商品销售有关的知识的方法,提出了运用背景知识与面向属性归纳挖掘特征规则的思路.论文通过试验,实现了挖掘特征规则的原型系统,进一步提高了对规则的解释能力.
其他文献
集装箱运输与集装箱港口行业的发展是国际贸易繁荣的重要保障。在国际集装箱运输链中,陆上部分的港口-腹地集装箱运输占据了总成本的一半以上,保证港口-腹地集装箱运输系统的运
本文首先从企业风险管理的历史、过程和目标方面综述了国内外最新的研究进展;在此基础上,提出了新颖的多对多企业集成风险管理模式;从企业集成管理理论和系统工程理论出发,使
本研究以任务型二语教学与写作的研究为基础,考察了任务复杂性对中等水平英语学习者写作质量的影响.结合目前任务型教学法(TBLT)的研究现状,对学习者的语篇进行句法复杂性、
作为新时代的大学生,身上肩负着的是对中国历史文明的传承,当代青年人的文化传承,离不开持续不断的精神需求,离不开真实存在的历史承载,离不开广大群众的共同努力,在探索社会
冷东-雷家地区沙一、二段及沙三段原油以重质稠油为主。重质稠油研究在建立本区流体性质分布及地球化学模型过程中占重要的地位。本文应用原油族组份、气相色谱、稳定碳同位素
凡“书道中人”,必为“文道中人”,自古亦然.诗、词、书法、篆刻、国画之中国精品传统文化,艺理相通,皆从“传统经典”中“来”,自“时代个性”中“出”,欧阳中石语“来有所
近年来,中国的城镇化建设取得了巨大的进步,城镇化水平不断提高,城市面貌发生翻天覆地的变化。大量农转非人口涌入城市,城镇人口膨胀,随之而来的是对各项建设用地的需求量增加,城市
摘 要:庄子所看到的人生充满了种种偶然和不确定,灾祸来源于四面八方,产生于各种偶然机缘。在社会上,是非善恶是混乱的,没有统一标准。  关键词:《庄子》;灾祸;茫然无依  作者简介:涂早玲(1992.12-),女,汉,河南省南阳市人,东北师范大学文学院在读硕士,研究方向:先秦道家方向。  [中图分类号]:I206 [文献标识码]:A  [文章编号]:1002-2139(2018)-06-0-01  
摘 要:评价理论是系统功能语言学在对人际意义的研究中的新发展,是一种新词汇语法框架,它关注在研究语篇的人际意义时产生的评价性意义。评价意义在翻译过程中是检验译文质量的重要维度之一。诗歌《无题》(相见时难别亦难)作为诗歌语篇,也结合了系统功能语言学中的概念、人际和语篇三大元功能。因此,本文依据评价理论,对《无题》(相见时难别亦难)及其五个英译本进行分析和对比研究,旨在论证该理论对诗歌语篇解释的有效性