【摘 要】
:
为从数据挖掘结果中获得真正有用的规则,探讨了评估规则的度量,提出了度量关系的新概念,并应用于发现与评估有用规则集的算法中。经过度量函数之间的相关分析,确定适合的度量
【机 构】
:
暨南大学计算机科学系,广东拓思软件科学园有限公司
【基金项目】
:
国家863计划资助项目(2006AA01Z190);广东省教育部产学研结合资助项目(2007B090400095)。~~
论文部分内容阅读
为从数据挖掘结果中获得真正有用的规则,探讨了评估规则的度量,提出了度量关系的新概念,并应用于发现与评估有用规则集的算法中。经过度量函数之间的相关分析,确定适合的度量,并据此对规则进行兴趣度评估,指导用户对有用规则的选择。此外,为了解决数据集成系统中存在"垃圾"数据的问题,提出了数据质量挖掘与控制系统框架,将数据挖掘规则应用于数据质量管理中。使用经过评估筛选得到的规则,能够检测数据库中的异常和不完整数据,解决数据集成过程中部分数据质量问题。通过企业信息集成实例,说明了规则评估及应用方法的有效性。
其他文献
怒江州旅游区域化开发是树立旅游品牌、营建区域性旅游供给市场和推动怒江州旅游深度开发的必然要求 ,其主要措施是在怒江州行政辖区内 ,以行政手段淡化各县、市之间的行政界
理清了人类发展指数(HD I)及其3个维度指标的内涵,介绍了基于熵权的HD I综合评价方法。选取HD I维度指标构建了区域可持续发展的评价指标体系。根据相关数据,运用基于熵权的
为了在审计实施方案设计中合理安排审计资源,降低审计成本,本文建立了嵌套循环分支定界的审计资源优化模型,利用Matlab进行求解,解决在可接受的审计风险范围内,估算审计项目
本文全面、系统地研究了鼓励向学前教育捐赠的税收政策。首先总结了向学前教育捐赠的三方面特点:学前教育捐赠的教育捐赠占比极低;学前教育捐赠与财政投入不匹配;学前教育捐
基于非定域干涉光程差级数展开的方法,通过对迈克尔逊干涉仪测He-Ne激光波长实验,探索了在干涉图样半径R≠0和不满足非定域干涉两种情况下,激光光波长的理论计算结果和近似结
为了解决在供应商的成本效率参数与努力水平信息不对称下销售商对供应商的激励问题,提出了显示原理和委托代理模型相结合的研究方法,并建立了最优静态契约。研究表明,在单阶
介绍了农业劳动力转移理论的主要类型和内涵,分析了农业劳动力转移培训的意义和特点,提出了我国应构建农业劳动力激励、培训就业服务中介激励、企事业单位激励等激励机制,并
普米族的研究颇受学术界关注 ,成果不少。本文从历史、社会经济、社会结构、文化等方面就普米族的学术研究状况作了综述 ,具有一定的参考价值
文件检验是一种常见的司法鉴定手段,是应用红外吸收、反射、投射、测光、紫外荧光和单色光激发荧光等光学检测原理,对文件中的掩盖字迹、压痕字迹、消退、涂改、擦刮、水印以
分析了市场竞争中产品"适者生存"的规律,提出新的产品创新设计方式——进化驱动模式。该模式强调:为适应市场竞争,在未发现潜在市场需求之前,产品应先行进化。基于该模式,构