Web日志挖掘预处理研究

来源 :北京机械工业学院学报 | 被引量 : 0次 | 上传用户:lowsong1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段.
其他文献
设计的脉冲发生器以DDS(Direct Digital Synthesize)芯片AD9851为核心,用单片机MSP430F169进行控制,通过改写DDS芯片AD9851的频率控制字,调节信号输出频率,频率范围为1Hz~70MHz.采用
华惠3号是湖北惠民种业有限公司与华中农业大学共同选育的早熟、抗病、抗虫、高产杂交棉新品种,2005年在湖北省预备试验中表现突出,2006年升入湖北省区试.2008年有望通过审定。
Snort是网络安全管理平台中被集成频率较高的一种入侵检测系统,收集Snort的报警信息是实现安全产品集成的前提.提出了一个基于XML(eXtensible Markup Language)数据转换、SSL
神经网络是当前主要的智能控制技术之一.依据厂家提供的大量PVC异型材的实际工艺参数作为样本,建立了PVC异型材性能参数的预测网络.采用BP算法对网络进行了结构参数调节及训
数据库的性能优化直接影响到整个数据库应用系统的高效运行。论述了Oracle数据库运行中的一些工作机制,优化模式,重点讨论了内存分配和磁盘I/O的优化。针对不同的数据处理方式.分
针对柴油机燃油系统的故障种类多的特点利用小波方法对燃油波形进行分析,提取时域及频域的故障特征参数,并使用粗糙集理论对这些故障特征参数进行约简,达到简化故障识别的神
海一鸥游艇有限公司是代弹销售国外知纪船艇并提供相关服务及设施的专营公司。海一鸥游艇有限公司注册于上海,分别在北京、大连、青岛、深圳设有分公司,在广州设有分销商。在重
介绍了公众满意度的概念、决定因素和测评方法,阐述了电子政务的理论及电子政务发展中存在的问题,并分析进行了流程再造的电子政务与公众满意度之间的关系。
磁性材料的磁光性质是人们很感兴趣的话题,磁极化子的色散关系和色散特性是研究磁性材料磁光性质的基础.研究了在Otto位型下单轴反铁磁薄膜的表面模和导模的色散关系.首先给
为了使电机的走位更为准确,达到精密控制的目的,设计了一种高精度的步进电机驱动方案。该方案基于MCU(C8051FDl2)+L297/L298(L6203)的经典架构,使用斩波恒流细分的驱动方法,在实际运行