基于数据仓库的决策树算法研究与应用

被引量 : 0次 | 上传用户:lanyinghit
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
职业培训是人力资本形成的重要手段。我国的培训在实施上往往采用统一培训的方式,忽视了“因人施教”的培训理念,没有针对性,整体培训质量低。将数据挖掘应用于培训领域,抽取潜在的有用模式和隐藏的信息,可以为受训者提供个性化培训的依据,提升整体培训质量。本文在对传统数据挖掘分类技术研究的基础上,分析培训领域特点,选择分类算法中的决策树算法进行该领域的数据挖掘。对决策树中的ID3算法进行深入研究,针对ID3算法的不足,结合国内外学者的一些研究成果,提出了一种新的属性选择算法。该算法在计算属性信息增益时,加入了属性取值个数和属性的类区分度,克服了ID3算法多值偏向及最优属性选择两方面的缺点,并通过一个实例和UCI数据集验证了改进算法的有效性。最后,在邮政储蓄实训系统中构建数据仓库,与联机分析相结合,将改进后的算法应用于该系统,建立了决策树模型。
其他文献
有机相变材料对于军事隐身具有重要意义,近年来世界各国的研究者对有机相变材料的定型方法进行了广泛研究,对物理及化学定型方法进行了回顾,并展望了该材料在军事上的应用前
4月15日,我有幸到泗阳中学参加了由《江苏教育院》杂志社主办,泗阳中学承办的中学高效课堂教学观摩与研讨活动现场会,上午听取了南京师范大学杨启亮教授关于“素质教育与考试竞
高校处于社会文明的前沿,是现代文明思想的发源地,是社会主义精神文明建设的示范地,也是邪教组织意图渗透的战略地。因此,反对邪教、传播科学不仅是高校义不容辞的责任,更是
概括性地介绍了国外对于SA8000和企业竞争力关系的最新研究进展,阐述了SA8000对企业竞争优势以及企业竞争战略的影响,提出了看待和利用SA8000的一种思路。
<正> 李××,女,50岁。1980年12月10日诊。患肺心病伴心衰及中心性视网膜炎已十余年。诊见:面色晦暗,唇紫,全身水肿,烦躁,双目视物模糊,视力减退,视野中有黑色斑状阴影。舌质
作为一种常用的测速设备,增量式编码器在电机控制中发挥着重要作用。为了能够更好地利用编码器提高测速和控制效果,本文讨论了编码器应用中常见的几种典型问题。首先,本文根
数学的定义揭示了数学的本质属性,对于中学生来说,如果能够准确地理解并运用它进行研究问题,显得尤为重要.结合高中数学教学实践,本文对巧用圆锥曲线定义解题作以下探讨.
目的:研究颅脑损伤后患者血清中TNF-α、IL-6及CRP的动态变化及意义。方法:100例颅脑损伤患者按照GCS计分法分为轻型组(38例)、中型组(32例)、重型组(30例)三组,30例健康体检者
知识产权战略实施绩效评估的关键部分是指标体系,专利指标尤为重要。然而,当前各种绩效评估过于注重大量使用专利数量指标,已经产生了不良导向作用。知识产权战略实施绩效评
<正> 巴赫金关于陀思妥耶夫斯基创造了一种新型小说模式——复调小说——的分析和理论概括,在苏联、欧美及近年的中国都有相当大的影响。其原因与其说在于巴赫金对一位俄国古