分布式挖掘多层模糊关联规则的算法优化研究

来源 :第二十一届中国数据库学术会议 | 被引量 : 0次 | 上传用户:daifei147
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是从大量数据的项目集之间的关联或者相关联系中来发现频繁项目集的主要技术和方法.本文引入模糊集理论和有效支持度的概念,并充分考虑有效支持度的阈值和有效支持度的支持频度,提出了一种新的产生频繁模糊项集算法的修改方案,由于有效支持度的引入直接作用于产生频繁模糊项集的最初端,在算法的执行效率上具有非常明显的效果,
其他文献
本文设计了一个基于本体的非结构化信息处理体系框架OBSA,并在此基础上提出了基于本体(Ontology)的以XML表示的非结构化信息的查询机制,从信息客体或信息对象出发,通过建立信息客体之间的概念联系和等级关系,将对信息客体的揭示深人到知识内涵的层次,让用户在其所熟知的概念层实现信息的查询访问而不必关心XML文档本身的结构,更为重要的是该机制描述了信息客体内在联系的推理规则,使得获取隐含于文档中的
本文首先分析了多数据库系统中并发控制所面临的问题,之后根据LDB的自治程度对已有的多数据库系统并发控制方法进行了总结和分类,并对每种方法的利弊作了详细的讨论和分析。
由于多库系统底层数据库的异构性,因此一个多库系统中,可能有些底层数据库是未知的DBMS,有些是基于SP调度的DBMS,还有些是强可恢复DBMS等,在这种情况下,如果我们都把它们当作未知的DBMS来进行多库系统的全局并发控制,显然会损失很多全局事务的并发度。基于这个思想,本文提出了一种新的多库系统并发控制策略一集中式保守并发控制框架.该方法基于多库系统中所有底层的DBMS都采用SP调度的假设,如果底
使用基于知识的方法解决语义问题是目前研究较多的方向,其出发点是希望利用经验和领域分析的结果建立一套统一的知识背景,从而统一领域内用户对信息的理解.本文提出的设计模式就尝试将本体概念和传统数据库设计方法结合起来,在关系数据库设计阶段就引入语义信息的设计模式,使得智能代理能够从语义的角度理解传统的关系数据库。本文以学校的电子教务系统为背景,介绍基于本体的关系数据库的语义设计模型。其特点是通过对领域内知
Web Services是一种在Internet上动态共享应用数据和功能的手段,为构建高效、灵活的新型软件应用提供契机。CORBA在企业级应用集成取得极大成功的同时,延伸到Internet有一定的局限性.本文提出CORBA Web Service,静态、动态两种体系结构,重点研究可扩展体系结构、SOAP/IIOP协议数据类型映射、统一服务提供框架和服务动态发布等多项关键技术,将面向企业的相对封闭、
本文就分布式数据库系统中基于并行分层式链路的P2L2PC协议进行了研究。研究表明,P2L2PC协议是在2PC协议基础之上的扩充,P2LZPC协议中发生的消息交换可能是并行的,而且对并行消息的反应也进行推断,既保证并行消息的补偿性又使并行消息不产生逻辑上的冲突,这也是P2L2PC协议和传统2PC协议的区别,也是P2L2PC协议本身的优点所在。P2L2PC协议有其特定的优点,尤其是P2L2PC协议的较
本文介绍了一个对来自多数据源的汉语短文进行话题识别的系统及其实现方法。从初步的模拟实验结果来看.该系统达到了预期的目标,系统中使用的词频统计方法和短文聚类方法是有效的。对系统的完善和进行实际环境中的完整测试还需要做大量的工作。短文的聚类问题仍是今后需要研究的重点。
本文提出了基于嵌入式数据库实现语义缓存的技术方案(SCEDB, Semantic Cache Based on Em-bedded Database),由于采用嵌入式数据库,在客户端缓存的查询与结果可与服务器的数据库管理系统在数据存储和运算上实现统一,也便于实现客户端的查询/修剪,替代策略。SCEDB的设计采用独立部件化设计方法,能最大限度节省客户端开销。
本文为了避免不必要的关闭结点的磁盘访问,提出了一个可以减少磁盘访问次数的快速Dwarf计算算法QDwarf,该算法能实现一个关闭结点写入磁盘后,不需再读出,实验表明,新的算法在计算性能上有明显的提高。
信息系统常采用知识导航模块,该模块的核心是框架本体库,因为框架表示能够通过对象的联系属性在不同概念之间建立联系,其数据结构适合知识导航.当前,本体主要有逻辑表示和框架结构表示.框架表示法的优点是直观,其数据结构适合知识导航.逻辑表示法能表达复杂的问题,语义清晰,具有自动推理功能,但是不能直接用于知识导航.要使现有的描述逻辑本体库能够为知识导航服务就必须转化为框架本体库,建立框架本体库中概念之间的关