Bad:基于最小描述长度的均衡离散化方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:manuka
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续数据离散化是数据挖掘分类方法中的重要预处理过程。本文提出一种基于最小描述长度原理的均衡离散化方法,该方法基于最小描述长度理论提出一种均衡的离散化函数,很好地衡量了离散区间与分类错误之间的关系。同时,基于均衡函数提出一种有效的启发式算法,寻找最佳的断点序列。仿真结果表明,在C5.0决策树和Naive贝叶斯分类器上,提出的算法有较好的分类学习能力。
其他文献
公诉机关提出的起诉裁量建议,如不起诉决定,由于较少考虑其他诉讼主体的利益而往往不能被广泛接受。运用经济学的博弈理论来分析不起诉裁量行为中检察官、被害人与犯罪嫌疑人
通过一个简化的2-bit问题对多智能体社会进化算(MASEA)中的进化算子及其组合进行形式化描述,分析了MASEA的全局动力学形态。针对算法中的进化算子建立数学模型,通过分析模型中各
根据电影拍摄的"轴线规律",本文给出了一种简单的电影场景的定义方法,并根据该场景定义,提出了一种电影场景检测算法。算法首先使用改进像素点匹配二次差分法进行电影镜头的检测,然后根据自定义的镜头相似性判断原则进行镜头聚类得到电影场景边界。实验表明,该算法可以有效地检测出电影场景边界。
针对现行的软件工程人才培养模式,提出并实施了以合作企业真实项目进行实训的方式,推动软件工程教学改革,加强学生动手能力的培养,让学生将所学到的理论知识在实践中加以运用
本文实现了统一建模语言(UML)描述的模型与企业过程建模系统(EPMS)模型之间的转换。UML的特点是便于建模,主要用于对软件的描述,不能进行模拟执行和优化。EPMS对业务过程进行建模,用
搜索引擎结果聚类对提高搜索引擎服务质量和智能化水平有较高的应用价值,它是从标题和文档片段的有限信息中寻找文档相关度进行聚类。传统搜索引擎聚类没有充分利用搜索引擎
针对同一场景多聚焦图像的融合问题,本文提出了一种基于非下采样Contourlet变换(NSCT)多聚焦图像融合算法。首先,采用NSCT对源图像进行多尺度、多方向分解,得到低频子带系数和各带通方向子带系数;其后,针对低频子带系数的选择,提出了一种基于方向向量模和加权平均相结合的融合规则;然后,针对带通方向子带系数的选择,提出了一种基于改进的方向对比度和局部区域能量相结合的融合规则;最后,经NSCT逆
OpenSparc T2处理器是Sun UltraSparc T2处理器的开放版本,它提供了虚拟化的硬件支持。本文从T2处理器的硬件特性开始,分别描述了T2处理器支持虚拟化的硬件机制,介绍了T2平台系