基于Web的数据挖掘技术研究

被引量 : 6次 | 上传用户:lqw1100
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的飞速发展,经济和社会都取得了极大的进步,与此同时,在各个领域产生了大量的数据,激增的数据背后隐藏着许多重要的信息。人们不再满足于数据库的查询功能,希望能够对其进行更高层次的分析,以便能从数据中提取信息或者知识为决策服务。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则,无法根据现有的数据预测未来的发展趋势。缺乏挖掘数据背后隐藏的知识的手段,导致“数据爆炸但知识贫乏”的现象。同样,传统的统计技术也面临着极大的挑战,这就急需有新的方法来处理这些海量数据。数据挖掘就是为顺应这种需要发展起来的数据处理技术。尽管数据挖掘是近年来出现的新技术,但是它已用于企业决策支持,市场策略制定等,并将成为决策支持系统(Decision Support System,DSS)的重要组成部分。 目前因特网是一个巨大、全球性的信息服务中心,且分布广泛,它涉及新闻、广告、消费信息、金融管理、教育、政府、电子商务和许多其它信息服务。Web 包含了丰富和动态的超链接信息,以及 Web 页面的访问和使用信息,这为数据挖掘提供了丰富的资源。Web 数据挖掘是传统数据挖掘技术在 Web 环境下的应用,试图从大量的 Web 文档集合和用户浏览 Web 的数据信息中发现蕴涵的、未知的、有潜在应用价值的、非平凡的模式。应用 Web 数据挖掘可以改善人们获取信息的速度和准确度。 本文对数据挖掘技术进行了概述,在详细介绍 Web 挖掘技术的基础上着重分析和研究了 Web 内容挖掘 (Web Content Mining)、Web 结构挖掘 (Web Structure Mining)、Web 使用记录挖掘 (Web Usage Mining) 技术。并且设计了一个基于 Web 数据挖掘的应用系统。
其他文献
本文以超声波(Ultrasound)和臭氧水(Ozone Water)为保鲜手段,研究其对冷藏条件下荔枝(Litchi chinensis Sonn.cv.Guiwei)生理生化的影响。在以前研究的基础上主要涉及以下几
随着全球经济一体化的快速发展,特别是加入WTO以后,我国在三五年内逐步放开国内成品油市场,这意味着中国石化将直面国际成品油市场的竞争。很多跨国石油公司纷纷把中国作为战
水泥混凝土是当今广泛采用的人造材料。随着建设事业的发展,混凝土材料在工程中获得了更加广泛的应用。许多专家学者预言,二十一世纪混凝土仍为主要的建筑材料。 高性能混
审前羁押是各国刑事诉讼中广泛采用的一种人身强制措施。在法定的条件下,对犯罪嫌疑人、被告人实施审前羁押,能有效排除其阻碍侦查活动顺利进行的行为,为侦查机关探究案件真
纱线毛羽是当今纺纱技术中亟待解决一个难题,早期由于我们大量采取了使用后道整理工序对前道纱线毛羽的疵点进行消除、弥补等措施,所以对纱线毛羽并不十分计较。随着当今生产
生态农业是农业发展史上的重大变革,它代表了未来农业的发展方向,成为了各国农业发展模式的共同选择。本文通过对南雄市生态农业发展的探讨,介绍南雄生态农业发展的基本情况,
档案作为重要决策的真实记录,对于企事业单位、国家机关尤为重要,其管理工作需要得到重视和规范,以协助提升机关各部门之间的协作效率。本文着重介绍机关档案整理的几点规范
目的总结VonHippel.Lindausyndrome(VHL综合征)累及肾脏、胰腺及肾上腺的cT表现,以提高对本病的认识。方法收集临床符合VHL综合征诊断标准且有腹部受累的病例9例,回顾性分析其临床
农药残留检测,是农产品质量安全控制的关键手段,而对于蔬菜等鲜活农产品中农药残留的快速检测,更是相当一段时期控制质量安全的重要内容,本研究比较测定了小白鼠肝脏和蜜蜂头
我国城市社区建设是在两大背景下推演开来的。一是宏观的制度背景,政治体制改革导致政府职能转变、行政权力下放和部分退出社会管理领域,经济体制改革则促使企事业单位功能专