快速挖掘频繁可信关联规则的系统

来源 :中国科学院计算技术研究所第七届计算机科学与技术研究生学术讨论会 | 被引量 : 0次 | 上传用户:huanhuan879600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在需要挖掘关联规则的企业应用中,用户要求应用系统能够快速产生既满足最小支持度又满足最小置信度的某些特殊规则.但是传统的挖掘算法Apriori和TP-growth等不支持基于置信度的挖掘,同时传统挖掘方法会挖掘出所有的关联规则而使执行效率低下,不能满足用户的要求.为此我们提出了ESPFCR系统,该系统引入了国外的最新研究结果-PR模式库和基于置信度的算法,以码表、模式库PR为基本数据结构,有机集成TP-growth算法、基于置信度的剪枝算法,能够快速生成既满足最小支持度(频繁)又满足最小置信度(可信)的规则.
其他文献
目前大部分搜索引擎采用全文索引,而它们的预处理方法几乎保留了HTML文件中所有的信息,这不但降低了解析的速度,而且搜索到大量的无关项,本文针对这一情况提出了一种解析HTML
景象匹配技术是巡航导弹实现精确末制导的关键,而景象匹配算法是这一技术的软件核心.本文介绍了景象匹配算法,分析了实际应用中影响匹配性能的因素,对两种经典的匹配算法,MAD
本文详细描述了三层交换机路由核心模块的设计与实现.第三层交换技术也称为IP 交换技术或高速路由技术等,是相对于传统交换概念而提出的。众所周知,传统的交换技术是在OSI 网络
本文首次对JIAJIA和MPI进行比较.JIAJIA和MPI分别代表共享存储和消息传递的编程模式.MPI手工进行数据传输,编程复杂;JIAJIA由底层维护数据一致性,并提供简单的消息传递函数,
会议
以太网接入被看作是比较适合中国国情的宽带接入方案,居民小区组成以太网,每户独享10M/100M的带宽,通过千兆线路接入骨干网.本文介绍了我们设计的以太网接入智能交换机的软件
有关并行计算的通讯模型已经有很多了,其中比较著名的,并且又适合于机群系统(PC-Cluster)这种目前比较流行的并行计算环境的主要有:LogP,LogGP.在[参考文献4]所做的工作中详
会议
本文针对如何使不同企业,不同平台的多个工作流引擎协调工作,同时使工作流引擎与日益繁多的客户端,数据源更好地交互,提出了将表示层和转换层从原有的应用层分离出来,形成新
基于测量的连接接纳控制(Measurement-based Connection Admission Control,MBCAC)通过实时的业务流测量来对新的连接请求做出接纳与否的决定.MBCAC无须事先知道业务流的流量
会议
北京住房公积金管理中心等3部门近日联合下发通知,确定了大学生村官住房公积金缴纳办法。个人缴存比例由各区县确定,单位缴存部分由市、区两级财政承担。各区县大学生村官住
IPv6不但解决了当今IP地址匮乏的问题,并且由于它引入了加密和认证机制,实现了基于网络层的身份认证,确保了数据包的完整性和机密性,因此,可以说IPv6实现了网络层安全.但是,