挖掘Web数据

来源 :福建电脑 | 被引量 : 0次 | 上传用户:yeyeh
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着World Wide Web应用的逐渐普及,WWW已经发展成为一个巨大的分布式信息空间,为用户提供了一个极具有价值的信息源,但因Web所固有的开放性、动态性和异构性,又使用户很难准确快捷地从WWW上获取所需信息,为了解决这一问题提出了web数据挖掘这一概念.异构数据库环境和半结构化的数据结构是Web数据挖掘遇到的新问题.XML的出现为Web数据挖掘带来了契机.文中介绍了Web数据挖掘定义和分类,阐述了XML在Web挖掘中的重要作用,最后给出了一个基于XML的Web数据识别和抽取系统.
其他文献
采用剖开算子法,把水体年龄控制方程分成几个连续的初值问题。在任意三角形网格中,分别对不同性质的算子采用各自适合的算法,即采用特征线法求解对流分步,采用半隐式有限元法
电力线上网是一年来国内IT行业非常热门的话题,相关的公司也在极力推广这项技术.但围绕着这项技术,也引起了不小的争论.本文从电力线上网的技术、存在的问题、以及现状等作了
<正> 计算机技术作为新的一代科学技术越来越广泛地应用在工业、农业、国防建设、科学技术和经济管理等各个领域中。特别是近几年来,金融界迅速地成为计算机一大用户。各家银
<正>~~
期刊
目的探讨硫酸脱氢表雄酮(DHEAS)在糖尿病及冠心病发病中的临床意义.方法采用磁分离酶联免疫法测定了115例糖尿病患者和295例冠心病患者的血清DHEAS水平.结果糖尿病组及冠心病
本文介绍了单片机(微型计算机)技术、自动控制理论和植物栽培学等高科技在农作物温室中的应用,实现了对温室中温度、土壤水分含量及光照度的自动检测和控制,从而创造了温室中
针对量子粒子群算法求解水电站群优化调度问题存在的早熟收敛、寻优能力欠佳等缺陷,从种群初始化、进化和变异等方面提出了改进量子粒子群算法。该方法引入混沌搜索增强初始
结合全国317个气象站1956—2005年气象资料,分别利用普通Mann-Kendall、预置白Mann-Kendall、去趋势预置白Mann-Kendall趋势检验方法分析了年降水量、年平均气温和年蒸发皿蒸
传统固定结构的计算网格不适于处理计算边界动态变化的问题,利用动网格技术,结合土力学中粘性土河岸的崩塌机理,建立了可变网格下的堤防溃口展宽二维数学模型,在对模型进行验
目的分析肾脏无或少脂肪血管平滑肌脂肪瘤的影象学表现,探讨CT和MRI在其鉴别诊断中的价值。方法回顾分析13例经手术病理证实的非典型肾血管平滑肌脂肪瘤的影象学表现,所有病例