大学生体育训练决策支持系统中ID3算法的改进研究

来源 :科技创新导报 | 被引量 : 0次 | 上传用户:racheal2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:引入ID3算法的大学生体育训练决策支持系统可以根据学生的特征对其分类。而传统的决策树ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实。本文运用了一种基于灰色关联度的修正因子属性选择方法予以改进,克服了传统ID3算法的不足,改进的ID3算法可使分类更加精确,更好的为大学生体育训练提供决策支持。
  关键词:ID3算法 决策支持系统 数据挖掘 灰色关联度
  中图分类号:G434 文献标识码:A 文章编号:1674-098X(2014)02(a)-0019-01
  大学生体育训练决策支持系统是随着人工智能理论与数据挖掘技术的发展而不断发展的,通过对大学生身体素质和训练等数据来进行有效的挖掘,产生用于辅助决策的规则,进而为大学生体育训练制定相应的训练方案[1]。系统中应用了数据挖掘的决策树ID3算法对不同特征的学生进行分类,但传统的ID3算法存在多值倾向的问题,选择分裂属性不符合客观事实,同时,在构造树的过程中,需要多次自上而下对数据集的排序和扫描,因而导致算法的处理效率较低[2],如何改进算法从而使分类更加精确是我们亟需解决的问题。
  1 ID3算法的改进
  灰色关联分析是指对一个系统发展变化态势的定量描述和比较的方法,分析考虑了各因素之间的相关性,比系统分析中常用的因素两两对比法要更合理,更科学[3]。同时考虑到正弦函数的曲线变化比较缓和,对信息增益因子修正不会出现过度的问题。因此,本文引入灰色关联度的正弦值作为ID3算法的修正因子进行改进。改进的ID3算法的具体流程是:
  (1)计算各特征属性与类别属性之间的灰色关联度,并将它们排序;
  (2)对取值较多的属性通过灰色关联度来判断是否最优,从而确定是否降低它的信息增益;
  (3)对取值较多但灰色关联度低的属性,在计算其信息增益时通过灰色关联度的正弦值作为修正因子,而其它属性计算信息增益时修正因子设为0。
  改进的ID3算法的描述如下:
  算法:GBID(Sample_set,Attribute_set)
  输入:由多个属性描述的训练样本集Sample_set;候选属性集Attribute_set。
  輸出:一棵决策树。
  Begin
  如果 Sample_set为空
  则返回null;创建结点L;
  如果结点L中的所有样本均属于同一类C
  则返回L作为叶结点,并以类C为标记;
  如果Attribute_set为空
  则返回L作为叶结点,并以Sample_set中最普通的类标记;
  计算出Attribute_set中每个属性的信息增益,并选择出信息增益最大的属性A和取值个数最多的属性B
  如果 A=B,该条件成立说明选择信息增益最大和取值个数最多的属性作为测试属性易产生多值偏向问题,需要用修正因子降低该属性的信息增益
  则根据公式
  属性A具有多值倾向是其它来计算该属性的修正因子;
  再根据公式重新计算该属性的信息增益;
  否则该属性的修正系数为0,信息增益最大的属性不是取值个数最多属性,选择该属性作为分裂属性不会产生多值偏向问题,不需要用修正系数降低该属信息增益
  从Attribute_set中选择出信息增益最大的属性Splitting_Attribute作为分裂属性;
  标记结点L为Splitting _Attribute;
  For Each Splitting_Attribute中的已知;
  m为Splitting_Attribute的取值个数∥根据Splitting_Attribute的取值划分Sample_set
  根据Splitting_Attribute=,从结点L产生相应分支表示测试条件;
  设为Splitting_Attribute=所获得的样本集;
  如果为空
  则加上一个叶结点,并标记为Sample_set中最普通的类;
  否则加上GBID(Attribute_set,Splitting _Attribute)返回的结点;
  End。
  2 改进后的ID3算法的应用
  我们选取十个学生的篮球训练样本集作说明,每个学生有四个属性,分别为力量、身高、灵活性、速度。每条学生记录为(学号 力量 身高 灵活性 速度 评价),十条学生记录为(20100001强高好慢Y),(20100002强高好块Y),(20100003强矮好慢Y),(20100004强中一般慢N),(20100005弱中差慢N),(20100006弱中差块N),(20100007弱矮差快N),(20100008强高一般慢Y),(20100009弱高差慢N),(20100010弱中一般慢N)。力量为强、弱,量化为{0,1};身高为高、中、矮分别量化为{0,1,2};灵活性为好、一般、差分别量化为{0,1,2};速度为快、慢量化为{0,1}。根据训练集样本数据,依次根据公式计算各特征属性与分类属性的灰色关联度,结果为r(力量)=0.52,r(身高)=0.72,r(灵活性)=0.78,r(速度)=0.56,然后计算上述属性信息增益,可得Gain(力量)=0.4816,Gain(身高)=0.0275,Gain(灵活性)=0.0588,Gain(速度)=0.0368,因为力量的信息增益最大、取值个数最多但灰色关联度最低,所以需要用修正因子降低其信息增益,设定修正因子CF(力量)为sin(0.52)=0.4968,而其它属性的信息增益设定为0,则改进的ID3算法算得的Gain(力量)=-0.2196。因而会选择信息增益最大的灵活性作为分裂属性。
  从上面实例可知,ID3算法确定决策树的根节点时,选择信息增益最大的力量作为分裂属性,显然这与客观事实不符。而改进的ID3算法在确定根节点时,选择灵活性作为分裂属性,符合客观事实,避免了多值但非最优属性的力量成为分裂属性。
  3 结语
  改进的ID3算法避免了传统算法的多值倾向问题,使分类更加精确。首先,通过训练集总结出学生分类模型,通过上述模型我们可以对新加入的学生进行预测,然后再将不同的学生根据模型添加到不同的类型中。把不同学生的特征存入了相应的用户库之后,教师可以通过它及时地了解学生的信息,并以此为依据为不同的学生提供不同的教学策略的决策支持。
  参考文献
  [1] 王鑫,王建伟,钟玉峰,等.个性化远程教学平台中数据挖掘技术的应用[J].黑龙江工程学院学报(自然科学版),2010(24):72-74.
  [2] 孙卫强.决策树方法在远程教育辅助教学中的应用研究[D].中山大学,2010:22-25.
  [3] 叶明全,胡学钢.一种基于灰色关联度的决策树改进算法[J].2007,43(32):171-173.
其他文献
摘 要:以上海海洋大学水产与生命学院开展大类招生工作的简况为切入口,从教育模块课程设置和教学资源配置两大方面对大类招生体制下人才培养方案改革的举措进行讨论和探究,并通过与国内同类院校的比较对人才培养方案改革进一步指明了方向:(1)优化方案结构,明确基础知识需求;(2)扩大选修比例,加强培养体系灵活性;(3)强化实践环节,提升专业技能内化;(4)注重专业素养,革新创新学分认定方式。  关键词:上海海
期刊
摘 要:針对潜油电泵存在偏磨的现象,详细分析了潜油电泵偏磨的失效形态和失效原因。重点讨论了振动对潜油电泵偏磨的影响,指出多级泵的振动是产生偏磨的最主要原因。在此基础上,提出了相应的解决方法。  关键词:潜油电泵 偏磨 振动  中图分类号:G206文献标识码:A文章编号:1674-098X(2013)05(b)-0056-01  1 潜油电泵偏磨失效形态分析  自2010年以来,因离心泵偏磨造成胜利
期刊
摘 要:病理学是一门十分重要的医学课程,病理学知识的掌握对于今后学习临床医学知识至关重要。建构主义理论的核心是以学生为中心,强调学生对知识的主动探索、主动发现和对所学知识意义的主动建构,得到了当代最新网络信息技术成果的强有力支持。基于多媒体网络技术的建构主义理论对于促进病理学教学改革、改善学习方式和提高教学效果发挥着重要作用。  关键词:病理学 建构主义 多媒体网络技术  中图分类号:G421文献
期刊
摘要:它是全亚洲最大的建筑物;它是亚洲最大的单栋式酒店;它是全亚洲最大的赌场;它拥有亚洲首间最大的“曼联旗舰店”;它是亚洲地区最大型的会议展览中心。它是近年来人尽皆知的综合商业体,这栋建筑几乎包括了澳门四周各种领域综合体建筑的全部特质。它就是威尼斯人,会是你去了澳门后留在心中永恒的牵挂。  关键词:威尼斯 设计 室内 建筑 空间  中图分类号:TU201文献标识码:A 文章编号:1674-098X
期刊
摘 要:本文针对配电系统的脆弱性评估与控制问题,将云计算理论应用到配电网脆弱性的分析研究中,设计了基于云计算的配电网系统分层控制结构,并利用风险评估的风险指标实现了配电网脆弱性评估的功能。  关键词:脆弱性 配电网 云计算 风险评估  中图分类号:TP393.08文献标识码:A文章编号:1674-098X(2013)05(b)-0038-02  随着现代化工业的发展,我国电力系统的规模越来越大,以
期刊
摘 要:古树名木是活的文物,是城市建设中人与自然和谐共处的生态文明成果之一。古树名木历经风雨及其他原因衰败甚至死亡。从养护工作中入手,调查研究,实地勘察,基于国内相关研究,提出土壤改良、树洞修补、创伤修复等,恢复古树名木的生长势的复壮技术。  关键词:土壤改良 树洞修补 创伤修复 复壮 古树名木  中图分类号:S725文献标识码:A文章编号:1674-098X(2013)05(b)-0025-04
期刊
摘 要:该文通过对河北省部分图书馆馆员培训情况的调查,较为清楚地了解了我省图书馆员培训的现状,针对存在的问题进行了较为深入地分析,并提出解决这些问题的办法和途径,对于提高省内各级各类图书馆员培训具有重要的现实意义。  关键词:馆员培训 调查报告 培训创新  中图分类号:G251.6文献标识码:A文章编号:1674-098X(2013)05(b)-0205-02  为了解我省图书馆馆员培训的现状,课
期刊
摘 要:珍贵树种是指资源稀少、品质优良,具有药用、园林、生态等重要用途和特殊文化意义、科学价值及较高的经济价值。红安县珍贵树种培育取得了一些成就,但还存在着一些问题,针对红安珍贵树种培育存在的问题,提出了加强领导、制定规划、强化科技支撑、注重价值宣传等对策建议。  关键词:红安县 珍贵树种 培育 建议  中图分类号:S781.83文献标识码:A 文章编号:1674-098X(2013)05(b)-
期刊
摘 要:该文以SCARA型手臂作为研究对象,构建轴承受力计算模型,利用赫兹接触理论计算负载引起的轴承变形量。将结果与手臂有限元分析结果叠加,最终求出机械手手臂柔顺度。通过实验值和理论计算值对比,计算值误差仅为3%,计算方法满足机械手手臂柔顺度产品开发需要。  关键词:轴承变形量 SCARA型机器人 手臂柔顺度  中图分类号:TP241文献标识码:A 文章编号:1674-098X(2013)05(b
期刊
摘 要:实践教学是使更好地理解知识并掌握专业技能的重要环节,是实现理论知识向能力转化的重要途径,对学生踏入社会后更好地适应工作也起着桥梁作用。为了让学生掌握更牢固的《固体废弃物处理与处置》专业知识,针对固体废弃物处理与处置课程实践性强的特点,我们在充分利用本地的社会实践教学资源进行固体废物处理与处置的实践教学的基础上,积极探寻校内现有资源进行实践教学,进行了典型固体废弃物资源化方面的探索。通过对身
期刊