【摘 要】
:
提出了一种新的三维频繁闭项集挖掘算法MFCC. 算法采用降维的思想,首先将三维数据集切片为若干个二维数据集,并应用适当的二维频繁闭项集挖掘算法进行处理,得出二维频繁闭项集结果;再通过对二维切片上的结果进行相交,并结合有效的削减规则,快速得到所有三维频繁闭项集.算法具有以下的优点:1) 可以根据不同数据集的特点选择最有效的二维频繁闭项集挖掘算法,具有很大的灵活性以及提高效率的潜力;2) 高效的削减规
【机 构】
:
东北大学信息科学与工程学院,沈阳,110004
论文部分内容阅读
提出了一种新的三维频繁闭项集挖掘算法MFCC. 算法采用降维的思想,首先将三维数据集切片为若干个二维数据集,并应用适当的二维频繁闭项集挖掘算法进行处理,得出二维频繁闭项集结果;再通过对二维切片上的结果进行相交,并结合有效的削减规则,快速得到所有三维频繁闭项集.算法具有以下的优点:1) 可以根据不同数据集的特点选择最有效的二维频繁闭项集挖掘算法,具有很大的灵活性以及提高效率的潜力;2) 高效的削减规则能够削减掉所有不能产生三维频繁闭项集的分支,从而避免了对结果进行额外的封闭性检验.理论分析及实验表明,MFCC算法的性能优于同类算法.
其他文献
舆情是指一定时期内一定范围内的社会群体对某些社会想象和现实的主观反映,实时地计算舆情能够及时掌握真情动态、积极引导社会舆论.基于文本数据,提出了一种多维层次式舆情计算模型——文本立方体模型.该模型能够从多维度、多层次上来计算舆情,同时对文本立方体模型进行了钻取与切片操作分析.最后建立了文本立方模型的原型系统,通过实验分析,验证了文本立方体模型的有效性与实际可行性。
Web服务技术受到学术界和产业界越来越多的关注,其应用也越来越广泛.功能相同或类似的Web服务数量日益增加.在使用某个Web服务之前,服务消费者通常需要有关web服务的服务质量(QoS)方面的信息,然而,目前的UDDI注册中心只描述Web服务,并没有对其质量进行评估.服务质量信息对服务的管理和发现起着至关重要的作用。提出了一种基于QoS的Web服务发现模型QSWS,在此模型中,按Web服务消费者偏
Database-As-a-Service(简称DAS)模型为企业提供了一种创建、存储和操作数据的无缝机制,并且负责数据库的备份、恢复和移植.企业无需购买软硬件设备,也无需雇用专业人员,只需使用Database-Service-Provider(简称DSP)提供的数据库服务,所以它能显著地减少企业使用数据库的成本.目前许多研究提出了DAS模型数据加密方法和密文数据库的查询技术,但在这些现有技术上的
本文对基于内容图像搜索的医学图像数据库建立进行了研究。文章围绕图像一致性的预处理、多维标志医学信息存储、嵌入相似性度量方法、语义图像特征提取等进行了阐述。
本文提出了一种分布与集中特点相结合的两段式Web服务发布和发现体系PWSD。服务注册中心分散化,每个注册中心作为P2P网络的一个节点,各自保有独立的服务信息。服务提供者以集中的方式向注册中心发布服务,注册中心间则采用分布式的P2P技术进行Web服务信息的存储、交换查询。
个性化推荐系统的目标是推荐最合适的资源给最需要的用户,这种推荐多数是基于用户的一些历史行为而做出的.如果有足够的历史记录,协同过滤推荐方法往往比其他推荐方法要好.然而协同过滤方法存在严重的冷启动问题,即当有新的用户、新的资源时,协同过滤就无法完成推荐过程.针对冷启动问题,提出了一种新的方法,核心思想是先构造出用户和资源的类别模型,构造出"用户资源对"来标记出用户感兴趣的资源.而对于新的用户,根据其
本文提出了一种新的支持QoS约束的服务发现模型SDMQo SDQM引人了扩展Web服务注册中心和资源信息服务两种新的角色,采用了QoS反馈机制、资源信息监控机制、基于用户反馈的服务QoS参数统计更新机制、基于用户偏好信息的服务选择机制以及资源信息服务报警机制,更好地满足了服务QoS的应用需求。
本文针对关联分类器会产生大量的规则,且效率比较低的问题,提出了以信息增益的方法来对每个类挖掘出来的规则进行重新排序,然后从每个类排序好的规则集中选取前K条分辨力强的规则构成分类器对文本进行分类,能够在规则集变小的情况下,取得比未修剪过的规则集更好的分类精度,同时也取得了比ARGBC分类器更好的分类效果。
本研究在分级标记粒度为元组级的基础上对BLP模型进行修改,定义了可信主体与其访问策略,一定程度上限制了可信主体权限,提高了安全性。依据客体结构的不同特点扩展了客体结构为树结构和图结构,指定了实体完整性与参照完整性,将其作为安全不变量保证系统状态的正确性与一致性,是适合于多级安全级数据库的安全策略模型。
本文结合已有面向Web的数据管理系统的优点提出了一种新的面向Web的数据管理系统框架,该系统框架使得开发人员能直接通过Web浏览器就可创建、修改、删除、维护和查询数据库,缩短开发时间,降低了开发成本,提高了数据独立性。