【摘 要】
:
本文提出了一种方法:在隐藏某些规则的同时保证不影响其他规则的挖掘并且可以避免挖掘者的重构,另外提供了一个修复参数,用于减小数据转换对挖掘结果产生的影响,初步的实验证明这种方法是有效的。
【机 构】
:
复旦大学计算机科学与工程系,上海,200433 上海宝信软件股份有限公司,上海,201203
论文部分内容阅读
本文提出了一种方法:在隐藏某些规则的同时保证不影响其他规则的挖掘并且可以避免挖掘者的重构,另外提供了一个修复参数,用于减小数据转换对挖掘结果产生的影响,初步的实验证明这种方法是有效的。
其他文献
本文主要是针对生物数据库中大量的数据冗余,给出了一个解决的框架,并试图基于这种框架给出一个解决的方法。主要思路就是对数据冗余先按照不同的蛋白质或核酸分成小的冗余块,并对每个冗余块先进行属性约简,然后针对冗余块,进行两层数据过滤处理,最后得到经过处理后的数据集。采用这种方法,不但能够有效处理生物数据库中的数据冗余,还从整体上减少数据处理的复杂度。但由于在相似过滤层中使用了比对算法进行相似度判定,造成
本文根据RBAC的基本概念和思想,结合数据仓库系统的实际需求,在访问控制方面提出了一个基本模型和一个扩展模型,并以此为基础对CWM进行了扩展。本文所开发的商务智能系统,在其运行和维护过程中遇到的访问控制方面的基本问题,都可以利用上述模型解决。特别是扩展模型,为系统的访问控制提供了相当的灵活性。对CWM的扩展是通过定义一系列新的类和类之间的关联关系来体现的。由于新的类是通过继承关系出现的,因此扩展的
本文首先根据澜沧江(渭公河)流域已有历史数据及应用需求,对澜沧江流域空间数据仓库(LCJ_SWD)原型系统进行分析、设计;其次,根据空间数据仓库设计建设中的常见问题,介绍了设计和实现该原型系统的关键技术,其内容涉及信息集成、立方体建立、多维分析和专题分析等方面。
本文借鉴已有容错CORBA中间件的解决方案,提出了一个容错Web服务框架FTWS,在FTWS中,服务的失效对客户完全透明,FTWS由复制管理、失效管理和日志和恢复机制这3个基本模块构成,详细阐述了FTWS的体系结构,并通过一个采用被动复制策略容错服务的3种状态来说明系统的工作流程。
本文根据石油测井曲线进行沉积微相识别的需要,阐述了曲线段的统计特征和拓扑结构、几何结构特征的表示,并构造信息系统,利用沉积微相评价进一步形成决策表,根据决策表的条件属性和决策属性进行模糊聚类,提取含有不确定性的决策规则,最后运用不确定性的推理实现沉积微相的自动识别。
本文在本地建立肿瘤基因表达数据库系统,用来存储从Intemet上获得的各种肿瘤基因表达数据,系统由数据库操作、数据下载、数据格式化、数据上传服务、数据更新和基于查询的数据分析等多个模块组成,能够很好地实现肿瘤基因表达数据的网络共享,是一种具有较强针对性的基因二级数据库系统,系统能够为基因组学功能基因的研究提供可靠的原始数据。
本文分析了以往索引方法的不足,并在此基础上提出了一种快速查询XML文档的索引结构,它将查询中出现的路径表达式作为一个整体来进行处理,对于含有"*"或"∥"的查询操作,能迅速定位所要查找的结点,实验表明,该索引能有效提高查询XML文档的效率。
本文介绍了一种基于构件的XML数据可视化表示和排版方法,具有以下特征:利用构件组装方法进行系统设计,将抽象的FO对象设计为可视化构件,用户排版操作被映射为可视化构件之间的组装协作,能快速根据规范或用户的变化需求做修改,提高了系统的易用性和可扩展性;从XSL-FO的格式化语义中提取出可视化构件特征模型;系统的设计和实现采用基于消息的体系结构风格,构件之间的连接器实现为消息分发器,该方法在XSLMak
本文基于早期的XML文档编码方案,改进了一种XML文档查询加速技术,充分利用编码方案中的前序遍历值、后序遍历值和层次信息,有效地缩小了路径查询表达式祖先-后代关系判断的求值范围,特别地缩小了父亲-孩子关系的潜在结果范围,分析和实验表明,提出的方法可从整体上进一步改善XML文档路径查询的效率。
本文针对诊断型专家系统,研究了相应的决策理论模型及有关算法,建立了一个基于贝叶斯网的序列诊断决策模型,在模型中,将影响选择的特征值分为疾病类和测试类,提出了一个测试优先级的算法,考虑了不同的特征值影响其他特征值权重的情形,采用了贝叶斯网络解决不确定性和不确定性传播的问题,该模型能帮助知识工程师对涉及序列诊断知识建模以及确定证据选择优先级,案例的实验结果表明,该模型明显优于传统的基于经验的诊断模型。