一个基于XML的WEB数据收集模型的研究

来源 :计算机工程与应用 | 被引量 : 0次 | 上传用户:llccxx1982
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前研究的热门领域Web数据挖掘是从WWW资源上抽取信息(或知识)的过程,是对Web资源中蕴含的、未知的、有潜在应用价值模式的提取。其一般的过程可表示为:信息的发现、信息的选择和预处理、分析过程、产生结果。WEB上的数据收集是对WEB数据挖掘的一种支持技术,是WEB数据挖掘的第一步。该文提出了一种基于XML技术的WEB数据收集模型,并实现了其中的一些主要功能。同时针对模型系统的不足做了一些有意义的改进探索。
其他文献
“让你有浑然忘我的感受,最有生活质感的专业经典SPA,都市女性放松身心的休闲天堂。”这就是总经理喻丽红创立武汉雪曼婷国际美容会所的初衷,她希望每位走进雪曼婷国际美容会所
如今国内美容展会的现状不容乐观。方面是美容行业内的展会越办越多,而参观人数却不住地下跌,人流的大量缩水令参展企业也失去争奇斗艳的动力,整个美容展会显得疲惫无力。
提出了一种基于多小波变换分层阈值的图像降噪的方法。此方法首先对一幅噪声图像进行多小波分解;接着根据多小波分解后的能量分布特性,在不同尺度的高频子带内,对小波系数进行不
《美容院》杂志与西蔓色彩公司联合主办的“美容&形象时尚新趋势”培训沙龙在广州成功举办,来自华南区域的近两百名美咨院的经营者、店长、美容师与美容企业的白领女性云聚一堂
一位《美容院》的读者在来信中曾经提过这样的问题:如何解决新开张美容院的客人八店?实际上.这并不只是新美容院所面临的困难.而是这个行业众多经营者共同面对的难题之一。而解决
热点事件回放就在前不久,媒体爆出染发课目可能致癌的说法,罪魁祸首直指染发课目中的对苯二胺。之后不久,风波再起,市场上的部分口服精油被控为香油勾兑制成,存在着严重的质量问题
该文较为详细地分析了网上虚拟实验系统需求和Java语言特征,论述了如何实现网上虚拟实验系统的设计模型,以及实现客户端和服务器端的关键技术并用代码进行说明。
文章对CRC校验算法的原理进行了深入分析,讨论了诸如移位寄存器初始值设置等在实际应用中算法遇到的问题,并给出了编码校验的范例程序。论文对MPEG-2系统层编码所用的CRC-32编
作为世界当前最主要的能源,石油在国民经济中有着不可替代的作用。我国炼油企业在新中国成立后,特别是改革开放以来,得到了快速发展,取得了举世瞩目的成绩。尽管2010年我国原油加
主要针对无热源厂的集中供热企业,介绍了供热企业的成本状况,供热成本的构成及降低供热企业成本、提高企业效益的措施。