基于数据挖掘的web行为特征分析与研究

来源 :福建电脑 | 被引量 : 0次 | 上传用户:hehong405
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web目前是一个巨大的、分布广泛的、全球性的信息服务中心,Web挖掘不仅仅是数据挖掘算法在Web数据上的应用,同传统的数据库数据相比,Web数据具有其特殊性,其特点就是数据没有严格的结构模式、含有不同格式的数据(文本、声音、图像等)、面向显示的HTML文本无法区分数据类型,并且存在大量的冗余和噪声,同时Web是一个动态性极强的信息源,所以面向Web的数据挖掘研究极具挑战性.本文对Web挖掘的特征进行了分析与研究.
其他文献
介质消耗是重介选煤厂的一大难题,本文对这一问题,对选煤厂介质消耗技术进行研究,以达到降低原煤加工成本,提高经济效益的目的。
计算机基础教育与计算机专业教育是两种不同性质的教育.本文提出在计算机基础教学过程中注重计算机文化素质的教育,着力培养学生对计算机科学的新思想、新知识、新技术的理解
近年来,移动网同步设备越来越多,它已经被广泛的应用在各地移动网传输线路中。但是这种设备在应用中极容易受到网络同步问题的干扰,给整个通信网络的稳定性、安全性造成威胁
在水利工程的建设施工中,灌浆施工技术占据着非常重要的位置,这项技术主要对大坝起到防渗和加固的作用,本文主要分析水工建筑基础灌浆施工技术,希望给相关行业的从业者提供经
随着我国经济的不断发展和公民环境法制意识的提高,环境纠纷呈现出逐年递增的趋势,已成为环保部门工作中的一个难点。文章中对处理环境污染事故和处理污染纠纷应注意的问题进
在科技领域内,通过研究物体的摄影图象来认识物体是广泛采用的一种方法。目前,应用电子计算机处理图象是最先进的方法。这种方法的大致过程是:将摄影图象转换成计算机能接受的数
四川达州州河特大桥是一座深水承台及桩基的高墩柱桥梁,其承台采用钢吊箱围堰的方法进行施工,利用加工定制的型钢拉压柱作为围堰的吊挂结构,将钢吊箱围堰悬挂在钻孔桩钢护筒
本文从五个方面综合分析了影响医院信息网络运行速度的原因,并阐述了提高网络速度的5种方法.文章认为,影响网络速度因素主要有:1)设备硬件原因:主要是指网络交换设备及计算机
坐标换算及换带计算虽有专用数表可供查算,但查表计算的工作仍相当繁复,而且容易出错。用T1-59电子计算器,采用本文提出的程序计算,只要输入三个起算数据,经一、二分钟的自动运算,
目的探究DWI和血管成像在急性脑梗死诊断中的临床应用价值,为临床提供指导。方法抽取来我院就医的50例急性脑梗死患者(2013年10月至2015年10月)作为此次实验的目标对象,对50