数据挖掘及关联规则挖掘算法改进

来源 :北京大学 | 被引量 : 0次 | 上传用户:scstscst24
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是信息技术自然演化的结果.随着信息技术的飞速发展,数据库技术已经系统的从原始文件处理演化到复杂的,功能强大的数据库系统.成熟的数据库系统保留了大量数据,可以广泛的使用.数据丰富但信息贫乏的状况带来了对强有力数据分析工具的需求,需要一种工具将这些数据转换成有用的信息和知识,用于指导包括商务管理,生产控制,市场分析和科学探索等在内的多种活动.数据挖掘技术由此应运而生.该文阐述了对北京大学研究生院近20年的招生数据的挖掘实验过程,对关联规则挖掘最核心的Apriori算法进行了详细分析,并根据实验的具体情况对此算法进行了改进,通过对项目加权实现了对用户兴趣度量的个性化处理,通过对算法实现方式的优化完成了对原算法搜索效率的提高.从两种算法的对比分析可以看出,改进后的算法更有助于高效地挖掘感兴趣的关联规则.
其他文献
虚拟场景中,动态不规则景物特有的动态性与随机性特点在烘托场景氛围,增强灵动性效果方面起着至关重要的作用。在传统静态景物建模过程中,通过一种或几种基本几何图元就可以构建
随着网络通信和高新技术的发展,图书馆的建设取得了巨大的进步,数字图书馆正在逐步成为现实.该文就数字图书馆展开讨论,重点针对数字图书馆的海量数据存储问题提出解决方案.
随着数据库技术的日益发展,以及在商业领域的广泛应用,用户对于数据共享的需求越来越强烈,如何保证这些数据的安全使用,成为一个十分重要的问题.一方面,这就要求数据库管理系
随着计算机网络的发展,安全问题日益突出.在现有的安全攻击中,通过缓冲区溢出进行的攻击占到80﹪以上,近年来更有种类增多、危害增大的趋势.现有的缓冲区溢出检测技术大多针对L
在计算机的普及和互联网的推动下,信息技术在人们生活中的地位日趋重要。信息技术给人们工作和生活带来了便利的同时,也引发越来越多的安全隐患,正因为如此,信息安全问题逐渐得到
软件技术的发展趋势之一是构建出平台独立的软件构件,现阶段,Web Services正在不断实现着这一目标.不远的未来,它们将广泛地存在于INTERNET分布式环境中,那时,新应用系统的生
文本挖掘是指在大量文本集合或语料库上发现隐含的、有趣的、有用的模式和知识.文本挖掘的出现,使得计算机处理大规模文本资源特别是网页资源成为可能,对文本的处理,在信息检
随着计算机技术和Interent的发展,电子商务呈现出蓬勃的发展,但是在现有的电子商务模式下,分布在互联网上的商品信息与用户之间缺乏一种有效的沟通机制,使得满足顾客需求的商
Peer-to-peer(P2P)是一种新的overlay网络结构,其核心问题是对象定位,即路由问题.该文的主要内容是以一个分布式存储系统——燕星2.0为背景研究P2P网络,讨论的问题包括P2P路
在许多最近出现的应用,例如传感器网络、金融分析和网络监测中,数据以一种连续的数据流的形式出现,而不是传统数据库中有限的数据集.数据流具有连续、无界、快速、时变的特点