基于杂度削减的连续属性离散化方法

来源 :统计与决策 | 被引量 : 0次 | 上传用户:kick3160288
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连续属性离散化在人工智能和数据挖掘领域具有重要的作用。文章用杂度削减指标来量化离散化后区间内的一致性和区间之间的差异性,进而提出了基于这一指标的离散化方法。通过调整最小杂度削减阈值并构建二叉树来确定划分区间的断点,能够有效地寻求全局最优的离散化方案。模拟实验验证了该方法相对于传统方法的优势。
其他文献
文章利用美元、欧元、英镑、日元与瑞郎1995~2010年面板数据,论证了主权货币国际化与主权国股市繁荣的协整关系,利用变系数模型比较分析了五种国际化货币对股市繁荣水平的具体影
聚乙烯醇缩丁醛,简称PVB。PVB由于具有优良的粘结性能和光学性能,广泛应用于安全玻璃的夹层主材料。低端产品建设用于建筑安全玻璃、高端产品用于军工上作为飞机、坦克、舰艇的
文章以系统动力学理论为依据,采用复杂网络动力分析方法,以信息系统建设形成的信息共享环境为基础,从微观层面,研究IT能力对流程拓扑结构的改变,阐述信息共享环境对信息集成
泊松回归模型是常用的索赔次数预测模型。但在实务中,索赔次数往往具有零膨胀特征,如果继续使用泊松模型会低估参数的标准误差,高估其显著性水平,从而在模型中保留多余的解释
文章假设产品的寿命服从正态分布,在无失效数据情形,当失效概率pi的先验分布为π(pi|b)=b(1-pi)b-1(1〈b〈c)时,给出了超参数b在3种先验分布下失效概率的E-Bayes(Expected-Bayes)估计
在人民币汇率市场化改革和服务业国际产业转移的背景下,人民币汇率已经成为国际经济活动中的重要影响因素。文章以香港对内地服务业FDI为例,从汇率水平、汇率波动和汇率预期三
文章建立了两个不同的财政分权与地方经济增长的统计模型。利用1999~2011年的省级面板数据,实证研究了我国财政分权对地方经济增长的影响,并提出了相应的政策建议。
文章在总结相关文献的基础上,对我国CPI的编制体系和流程进行了系统的梳理,并从理论依据、调查内容、调查方法和信息透明四个方面与欧美发达国家做了比较分析。
针对原始序列为单调递减的情况,文章按其级比序列的变化特征,把原始序列分为三种类型:(1)级比递减型;(2)级比平稳型;(3)级比递增型。为了提高原始序列的光滑度,文章提出了相应的离散