基于量化规则格的关联规则挖掘及其分布处理研究

来源 :扬州大学 | 被引量 : 0次 | 上传用户:sxhainan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
形式概念分析自1982年由德国的Wille教授提出以后,近年来被广泛用于软件工程、知识发现、信息检索等领域。概念格是形式概念分析中的核心数据结构,通过Hasse图来表现出概念之间的层次关系。基于概念格直接产生关联规则的时空复杂度非常高,从概念格中提取关联规则的一般过程是分两步进行,先构造概念格,然后扫描概念格来挖掘关联规则,计算过程的瓶颈在于概念格的规模随形式背景扩大呈指数级增长,提取规则的效率比较低下。本文主要围绕量化规则格和关联规则的优化提取做了相关研究,提出两种规则挖掘算法,简化规则挖掘步骤,并且实现了最小无冗余关联规则的分布获取。主要研究工作包括:(1)提出了量化规则格,一种基于概念格的扩展模型。在渐增构格过程中能产生每个概念所对应的最小项集集合(SLIT),从SLIT中可以直接推导出精确规则和近似规则,无须重新扫描整个格结构,计算速度和复杂性优于基于普通概念格的规则挖掘算法。(2)提出了一种基于量化规则格的规则渐增更新算法。对给定概念的SLIT,可以直接推导出精确规则,结合其对应的子概念SLIT,可以推导出近似规则,从而使整个规则挖掘过程整合在对概念的渐增更新中。(3)提出了一种基于量化规则格的关联规则分布获取算法。分布计算是提高性能的有效方法,通过对规则挖掘过程的步骤分解,给出了关联规则分布式提取方案,使最终的全局关联规则由部分关联规则合并计算产生。(4)扩展了P2P-MPI平台。采用JAVAMPI语言在深腾1800机群系统上实现了本文算法,同时给出了相关分析。
其他文献
城市报警与监控系统是公安机关进行预防、控制和打击各种暴力、犯罪活动的重要技术平台,依托公共网进行构建,如何确保内部网络安全以提供方便、快捷的接处警服务显的至关重要。
串匹配问题是计算机科学中的一个基本问题。精确串匹配技术要求模式与正文子串完全匹配,不允许有错误。但是在许多实际情况中,并不要求模式与文本子串完全精确匹配,因此人们引入
人工智能是计算机科学的一个分支,是研究解释和模拟人类智能、智能行为及其规律的一门学科。自主机器人的研究是目前国际人工智能的重要研究方向之一,而国际机器人足球比赛(Rob
无线Mesh网络和无线传感器网络是两类特殊的无线自组织网络。无线Mesh网络主要应用于替代传统的用于连接最终用户的最后一英里线路,以降低接入用户的布线成本。无线传感器网络
频繁项集挖掘可以广泛应用在关联规则挖掘、相关性分析、入侵检测、序列模式、分类和聚类等多种数据挖掘任务中。迄今为止已经提出了许多高效的频繁项集挖掘算法。本文对大量
软件规模估算是否及时和准确,对软件项目的成败具有决定性意义。功能点分析方法是国际上流行的软件规模度量方法,它以“功能点数”作为软件规模的单位。功能点数与编程语言无关
数字签名在提供消息完整性的同时,还能确保消息来源的真实性,使得消息具有不可否认性,在网络安全协议中具有重要而广泛的用途。网络环境中的一些数字签名应用,往往要求一方的实体
Web服务技术作为一种新型的应用技术,近年来得到了迅速的发展。它建立在XML基础上,是为解决应用层集成而提出的开放式技术架构。Web服务技术利用基于XML格式的SOAP消息进行数据
极小曲面问题,又称为Plateau问题,目的是为了寻找以给定空间曲线为边界的面积极小的曲面,它从18世纪提出到现在一直是微分几何和偏微分方程理论的重要课题。极小曲面的平均曲率
基于规则的语言模糊模型具有较高可解释性,但是由于对规则结构有严格的限制所以其模型的适应性不强因而精度低。相反,基于规则的贴近度模糊模型由于没有严格的规则限制而具有适