Web日志挖掘中的数据预处理技术

来源 :河北大学学报(自然科学版) | 被引量 : 0次 | 上传用户:wenruozhu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
用户访问网站,Web日志中会记录下大量的用户访问信息,通过挖掘这些日志数据可以获得相关页面、相似用户群体和用户访问模式等信息,Web日志挖掘对于优化网站结构、提供个性化服务和构建智能化网站具有重要作用.数据预处理是保证Web日志挖掘质量的重要基础,预处理主要包括数据清洗、用户识别、会话识别、路径补充和结果评价等工作.概述了数据预处理技术,重点介绍了目前常用的会话划分算法和评价标准,并实现了一个数据预处理系统.
其他文献
运输是物流活动的中心环节。从广州的地理位置、物流业基础设施、发展物流的经济技术基础条件、市场需求条件、通讯设施等方面进行分析,广州交通运输业开展物流活动具备天时
近年来,山西省洪洞县曲亭镇下峪村通过“四加强四提升”,不断提升村级党组织的领导力、号召力,整顿提升效果初显。加强组织领导,提升帮扶成效。县乡村三级联动,层层压实责任,
2018年以来,山西省天镇县依靠多种途径不断加强涉农干部队伍建设,实施乡村振兴战略。
利用所建立的分离测定2,4-二氯酚、2,6-二氯酚、3,4-二氯酚3种异构体的气相色谱方法,研究了相同条件下该3种异构体单独与混合降解时降解率的差异,以及降解率与光照时间、起始
推导二阶退化椭圆偏微分方程divA(x,▽u(x))=0的障碍问题的解的微商的局部可积性,此二阶退化椭圆方程需满足A(x,ξ)·ξ≥α | ξ| p,| A(x,ξ)|≤β(| ξ|+k(x))p-1,p>1.
通过对静电目标特性的介绍,了解到静电探测器采集到信号是个低频的变化过程.为了准确的识别目标,提出一种基于数字综合算法的干扰抑制滤波器方法.该方法通过在滤波器频率响应
在建立了柱型料仓内同轴电晕导线结构下的电场分布理论模型并在给出其精确解的基础上,精确推导出了Warburg 公式及其结构系数.经过一个严格的数学程序,获得了一个新的精确表
根据Gartner近日发布的《2007年上半年全球无线通信设备市场研究报告》,2007年上半年,全球无线通信设备市场新增商用合同环比显著下降,降至188个。但是,中国通信设备企业在全球市
高职教育应建立社会、学校、学生三位一体的评价主体和由教学行为个体、教学资源和运行系统构成的评价客体.高职教学质量评价应重视对课程目标和课程绩效的评价,课程目标和课
现在,我国已经进入了建设具有中国特色的、四个现代化的、高度文明和高度民主的社会主义强国的伟大历史时期。党中央实事求是地确定了我国经济建设的战略目标、战略重点、战