"单翼分解"下的纯度函数失效分析

来源 :第三届中国数据挖掘学术会议(CCDM2009) | 被引量 : 0次 | 上传用户:msdlzs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  纯度函数所衡量的纯度是决策树生成的依据,然而在某些情形下某些纯度函数却会失效,测不出纯度的变化。关于纯度函数失效的原因,有些文献只给出了含糊的解释,认为这是由于某些函数的预测性能比另一些更好。为了清晰地说明纯度函数失效的原因,本文首先拓展了纯度函数的定义,得到了一种能够方便地运用数学方法的新的纯度函数形式;并在这种新的纯度函数形式的基础上,在数学上严格地证明了,为什么有些纯度函数在这些情况下会失效,而另外的一些却不会。所谓的"预测性能好",其实质是什么。本文将指出,这种"预测性能"实际上与纯度函数某种特殊的"凹凸性"有关。这种凹凸性只在特定的方向才呈现出来。本文将通过若干定理,阐明如何通过赫斯矩阵寻找这些特定的方向;对于纯度函数,这种方向又是什么;这些方向上所展示的凹凸性有是如何影响函数的"预测性能"的。最后通过若干实验数据,形象地展示了文章中的结论。
其他文献
  针对SOM(Self-Organizing Map,自组织映射)算法在进行流形学习时容易陷入局部极值和产生"拓扑缺陷"问题的原因,本文提出了一种新的基于SOM的流形学习算法——TO-SOM (Tra
会议
经过改革开放30年的发展,中国的国际政治理念和目标经历了四个阶段:一是明确新的世界大战可以推迟和打不起来;二是确认和平与发展是时代的主流;三是把握和平、发展、合作的世界历史潮流;四是提出建设和谐世界。和谐世界理论的提出,充分确立了中国21世纪的外交战略目标,这一目标的提出既基于国内外形势的巨大变化,同时也标志着中国国际政治的价值取向由正义战争向和平伦理的深刻转型。
▲蕙兰佳品——蕙素里蝶该兰是1997年12月江苏宜兴兰友以高价引进的7苗高档蕙兰,如今一箭9花,纷纷放香,不仅是素心,而且花瓣蝶化。叶长50多厘米,宽1.2厘米,叶质厚实,叶面有
钦州地处桂南,气候炎热,雨量丰沛,高温高湿,番茄易受青枯病危害,具体防治措施如下:一、种番茄的田地实行十字花科和禾本科作物轮作3年以上,最好与禾本科进行水旱轮作。二、
  隐变量模型是一类有效的降维方法,但是由非线性核映射建立的隐变量模型不能保持数据空间的局部结构。为了克服这个缺点,提出了一种保持数据局部结构的隐变量模型。该算法充
会议
近几年来,由于市场行情的变化,普通桃价格与甜油桃价格悬殊较大。现有桃园有的品种混杂,品质较差,经济效益低,如果刨掉重植新品种,那肯定见效慢,投资大;如利用原有桃树进行高接换种,则
  特征选择是数据挖掘领域的关键技术,尽管已有很多的工作,但由于多标记学习问题的复杂性,其特征选择工作还很少。本文提出一个嵌入式的特征选择方法,MEFS(Multi-label Emb
  典型相关分析(CCA)的目的是通过最大化两组数据间的相关性来抽取典型成分获得降维特征,供其后的分类学习和识别.因此CCA通常仅作为分类学习的特征预处理工具,独立于其后
会议
  利用基因表达谱建立分类模型,找出决定样本类别的一组特征基因是建立有效分类模型的关键.本文对慢性浅表性胃炎脾虚证与正常人、慢性浅表性胃炎脾虚证与脾胃湿热证两组胃
会议
本文报告氧化钇和钇精矿粉尘所致大鼠肺肉芽肿病变的组织病理和酶活性改变。动物于气管内染尘后1、3、6、12及18月分别处死,取肺组织作光镜和酶组织化学观察。结果显示,氧化