【摘 要】
:
知道某事物的样本数据却不知其类标号属性时,一般只能对样本集进行聚类分析,但是聚类的结果在很多情况下是无法直接解决问题的。相反决策树算法以高准确性和实用性著称,但是
论文部分内容阅读
知道某事物的样本数据却不知其类标号属性时,一般只能对样本集进行聚类分析,但是聚类的结果在很多情况下是无法直接解决问题的。相反决策树算法以高准确性和实用性著称,但是决策树的建立需要对拥有类标号属性的样本数据进行训练,而现实是很多事物的样本数据缺少所需要的类标号属性。如何将这两种类型的算法结合起来达到优势互补的目的,是本文探讨的重点。
本研究主要内容包括:①对决策树C5算法进行研究。利用SPSS软件根据泉州初中学生3年数学成绩建立C5决策树,并对生成的决策树进行合理的分析。从而指导教师在恰当的时期有针对性对学生进行辅导,来提高中考及格率和优秀率,并为以后更详细的教学成果数据分析奠定了基础。②对模糊聚类算法进行研究。对长江流域主要城市水质的检测数据进行聚类。对三项污染指标的聚类结果进行合理的分析,以期发现被严重污染的水域和地区间污染的相关性,为彻底根治水污源头提供理论上的支持。③对聚类分析与决策树分类的结合点进行探讨。以聚类同分类的根本区别为切入点,在程序流程方面提出了一种新型的结合应用:利用层次聚类辅助决策树C5分类建模。提供了一种对缺少类标号属性的样本数据进行类标号填充后再进行分类的手段。本文的研究解决了当样本数据缺少类标号属性时无法进行决策树分类的问题,是聚类与决策树分类结合的深入应用。可以在满足应用所需特殊精度的要求下,把代价昂贵的分类手段转化成较为低廉的分类手段,在药品临床研究领域具有重要的意义。
其他文献
当前网络不良视频传播呈逐步上升态势,带有各种色情、暴力等内容的视频的传播,不仅对社会风气和群众身心健康造成了不利影响,也是诱发很多刑事犯罪的主要原因之一。遏制不良视频
面向返回导向的编程(Return-oriented Programming, ROP)是一种基于代码复用技术的新型攻击方法,攻击者从已有的库或可执行文件中提取指令片段,构建恶意代码来修改内存权限、
概率最小生成树问题是对传统最小生成树问题中树的顶点附加一定的存在概率,从而形成的一类重要的约束最小生成树问题,它是一个典型的NP完全问题,同时,对它的求解是一个NP--hard问
随着人造纤维板制造业的快速发展,对板材检测技术的要求越来越高,传统的板材检测方法效率低、速度慢,不能进行在线检测。数字图像检测技术是无损检测技术中的一种,它有着速度
伴随着网络等各种技术的快速发展,便携式的计算机和掌上电脑等无线终端使用越来越普遍,无线通信技术也得到迅猛的发展。但在一些特殊的场合,如发生洪灾、大的地质灾难、战争
随着信息时代的高速发展,推荐系统已成为电子商务领域不可或缺的一部分。推荐系统是为用户做信息过滤,通过预测得到用户潜在的兴趣产品。协同过滤作为解决信息过载的有效方法之
计算机网络规模日趋庞大,计算机技术的高速发展给网络安全现状带来严峻的挑战:网络攻击的复杂程度呈不断上升,而攻击者所需的知识水平呈不断下降的趋势。为了应对强大的网络攻
随着电子技术的发展,特别是半导体、集成电路和计算机技术的发展,移动通信得到了迅速的发展,应用领域的扩大和对性能要求的提高,促使移动通信在技术上和理论上向更高水平发展
无线传感器网络是当前计算机网络领域一个极为重要的课题,在军事国防、环境监测、生物医疗以及商业应用等领域具有广阔的应用前景。传感器节点的能量有限,极大的影响了网络的