使用长度递减支持度挖掘兴趣频繁模式和子空间

被引量 : 0次 | 上传用户:ITredfox
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
频繁模式是指数据集合中的项集、子序列或者子结构,它们出现的频繁度不少于用户设置的阈值。频繁模式在挖掘关联规则、相关规则和数据间的其它有趣关系方面扮演着重要角色,此外它还可用于数据检索、分类、聚类等其它挖掘任务。因此,频繁模式挖掘是一项重要的数据挖掘任务,且已成为数据挖掘研究中的焦点课题。本文对如何挖掘兴趣频繁模式及其在子空间聚类中的应用进行了研究。重点研究了以下两个问题:LDS-闭包频繁项集的垂直挖掘算法;如何使用LDS-频繁项集评估子空间的质量。本文的研究成果及创新内容主要包括以下几个方面:[1]提出了LDS-闭包频繁项集的垂直挖掘算法——LDS_CLOSED。[2]提出了两种新的搜索空间剪裁方法:无效前缀剪裁和基于SVE性质的剪裁。[3]试验结果表明,LDS_CLOSED不仅能够有效地控制频繁模式的数量,而且运行效率也远高于闭包频繁模式挖掘算法。[4]提出了一种适用于分类数据集的子空间质量度量方法;其特点是无需用户输入一些难以估计的参数,很好地体现了“无指导学习”的观点。[5]在子空间质量与LDS-(闭包)频繁项集之间建立起联系,从而解释了使用LDS约束条件的合理性。
其他文献
本文阐述了校园网络建设的时代背景、技术支持方案,并详细阐述了数字化校园内部综合管理系统设计的全过程。对网络系统规划、网络结构、硬件架构、综合布线方法以及管理系统中
随着3G通讯技术蓬勃发展,无线网络带宽迅速增长,以及移动终端运算能力的不断增强,使得移动终端可以获得传统有线网络视频服务,移动流媒体通讯技术成为了近年来网络技术发展的
脱机汉字识别是用计算机自动辨识印刷在纸上或人写在纸上的汉字,它涉及到模式识别、图像处理、人工智能、形式语言与自动机、中文信息、组合数学、模糊数学、信息论、处理等
随着近年来计算机技术的不断发展,计算机网络已经进入到了千家万户,日渐兴起的电子商务活动也越来越频繁。在这样一个大环境下,计算机网络中电子商务交易的安全也随之成为现有计
在网络视频监控等应用中,由于网络带宽的限制,要求视频编码器能够同时产生两种图像分辨率的码流,其中高分辨率码流用于本地存储,低分辨率码流用于网络传输;或者,高分辨率码流
企业的信息化处理,尤其是基于Web技术的电子商务B2B的模式是今后企业生存与发展的必不可少的基础。将软件应用集成到企业的IT环境的重要性和复杂性正逐步增长。各大软件巨头公
随着PDA、笔记本电脑和手机等移动设备的大量使用,越来越多的因特网服务将通过无线网提供给移动用户,人们希望在移动中保持Internet接入和持续通信,并获得像固定接入一样的网
随着嵌入式计算机技术的发展,外部存储设备成本逐渐下降,与之相对的,嵌入式应用所请求的数据量却日益剧增。如何有效的管理设备及其数据成为嵌入式系统开发中的重要问题。作
脑-机接口(brain-computer interface,BCI)是一种利用人脑生物电信号实现人脑与计算机或其他电子设备通讯和控制的系统。它正成为脑科学、计算机工程、生物医学工程及人机自
LCS(Location Service:位置服务)是近年来移动通信中备受瞩目的一种增值服务,是3G的重要内容。它通过一组定位技术获得移动终端的位置信息(如经纬度),以此实现各种与位置相关的