一种新的Web日志挖掘算法的研究

被引量 : 0次 | 上传用户:hunyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘技术是传统数据挖掘技术和Web这两个领域结合起来的当前热门课题,它对掌握用户在浏览站点时的行为、改善Web站点的结构以及页面间的超链接结构、提高站点的服务质量等方面具有重要的意义。 本文主要做了以下工作: 1.针对多页面结构的站点会降低挖掘结果的兴趣性,本文提出了Web日志数据预处理的改进算法-Frame页面过滤算法,实验结果表明,通过过滤用户会话文件中非用户点击产生的subframe页面请求,可以提高日志挖掘结果的兴趣性。 2.本文提出了一个新的Web日志数据聚类算法,该算法利用标称数据聚类直方图的几何特征,定义了一个全局准则函数,实验表明,该算法具有运行速度快,可扩展性好的特点,运用于维数高、数据量大的事务数据。 3.具体实现了Web日志挖掘的一个具体应用——实现实时个性化推荐的一个实例。 本文最后总结了工作中尚存的不足,并指出了Web挖掘研究的方向、应用前景和它所面临的挑战。
其他文献
森林景观资源是森林旅游的基础,森林景观资源区划与调查则是森林景观资源开发利用的前提条件。对森林景观资源进行调查应根据不同森林景观类型,结合景观所在地的实际情况,进
本文系统地分析了蒸发冷却技术的分类和基本原理,着重介绍了直接蒸发冷却和间接蒸发冷却,总结了蒸发冷却技术的应用与研究现状。基于已有的蒸发冷却过程的(火用)分析研究,对
苏联出兵中国东北以后,没有像中共希望的那样支持他们夺取政权,而是命令毛泽东到重庆与蒋介石进行和平谈判,以建立联合政府。与此同时,国民党对美国的依赖又迫使苏军借助中共
生产力是社会发展的最终决定力量。在网络经济兴起的时代,马克思主义者必须立足于生动的现实,以前瞻的眼光,将生产力理论研究推向深入,使之能充分地和社会生产实践结合起来,
电力工业是国民经济的基础产业,关系国计民生。长期以来,电力行业实行是垂直一体化的垄断管理模式,随着社会主义市场经济的建立,电力体制改革拉开帷幕,电力企业走向市场,参与
当今科技发展日新月异,“科技强警”已成为公安工作的基本战略。随着计算机技术及计算机网络的不断发展和推进,公安交通管理业务工作必须紧跟时代的脚步,在构建和谐社会的目
<正> 我国刑法理论一般认为,刑法中的法条竞合,亦称法规竞合,是指一个犯罪行为同时触犯数个刑法分则条文,这数个刑法分则条文之间存在重合或交叉关系,只能选择一个最相适应的
<正> 在中国现代思想文化界,冯友兰先生是公认的哲学大师。在二、三十年代,他撰写了被誉为“里程碑”的两卷本《中国哲学史》,开创了科学研究中国哲学史的格局。在三、四十年