利用数据库技术实现的可扩展的分类算法

来源 :软件学报 | 被引量 : 0次 | 上传用户:mt156
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
重点研究将数据挖掘中的分类技术与数据库技术紧密结合的高效的可扩展的分类算法.提出一种基于分组记数技术构造分类器的方法,利用数据库系统的结构化查询语言来实现主要计算任务.为了提高算法的执行效率,还提出了优化策略和冗余规则的剪裁策略,并将分类规则的发现过程与相关属性的选择方法有机地结合在一起.使用这些方法和策略,分类算法能够从大规模数据集中快速地发现一组简洁的规则.除了具有与现有分类算法相当的准确度和较高的执行效率以外,该分类算法还具有良好的基于训练集元组个数和属性个数两方面的可扩展性和易于实现的特点.
其他文献
创新是一个民族进步的灵魂。当代的图案设计教学中,教师的创新意识也是教学发展的不竭动力。那么,对于中职学生来说,学习这些课程的实质是什么?而我们要做的就是通过不断的创新与
李斌同志是上海液压泵厂生产第一线驾驭数控机床的普通工人。他毕业于技校,为了改变企业加工工艺落后、劳动强度大、质量不稳定、机床设备差的现状,考入电大“充电”。苦读三年
Unix Shell生成的命令历史记录是系统审计信息的重要来源,但它未能包含检测入侵所需的足够信息,且容易被用户本人篡改,利用可装入内核模块和系统调用劫持技术实现了对Linux Shel
小学生计算能力的培养是小学数学教学的一项重要任务。教学大纲要求学生在计算能力方面达到“熟练”、“比较熟练”、“会”三个层次,在计算的范围上做了“四个为主”和“三个
对2005年6月西江干流出现特大洪水期问及其前后的溶解有机碳(DOC)进行连续采样分析.结果表明,DOC浓度对流量变化的响应不敏感(n=43,R^2=0.23,p〉0.0.5),尽管流量有6—7倍的变化,但DOC浓度
提出一种恢复场景中所有物体的反射特性的方法.算法以一个全景图、场景的完整几何模型和光源信息为输入,结果是场景的一个完整反射模型.恢复是以逐步求精的方式进行的.先假定物体表面是漫反射面并生成一幅全景图,然后算法逐步迭代,比较绘制的全景图和原始全景图,如果有的物体的误差超过某个阈值,算法为
目的探讨肺硬化性血管瘤(PSH)的临床特点及外科治疗方法。方法分析我院1996年1月~2011年8月期间手术治疗16例PSH患者的临床资料。结果 16例患者术前均未确诊。术后病理及免疫组