基于最短距离聚类的K最近邻分类的研究及应用

被引量 : 0次 | 上传用户:nickyhuang00
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
师生的教与学离不开教材的支持,教材在整个教学工作中发挥关键的作用。目前,国家大力推进教材的编写和出版工作,进而涌现出了大批种类繁多、内容丰富的教材。同时,市场上的教材也呈现出参差不齐的现象,例如有些教材形式单一,配套资源不足,不能很好地适应经济社会发展对技能型人才培养要求等问题。因此,如何选取合适的教材来更好地为教学服务,已经成为教师和教学管理人员亟待解决的首要问题。通过建立科学合理的教材质量评估体系能够帮助教师和教学管理人员遴选更加合理的教材,进一步促进教学工作有效地开展,进而提升教育教学质量和人才培养能力。然而,应该如何建立科学合理的教材评估方法呢?只有经过严格准确的数据处理、计算和实验分析,才能保证评估结果的准确性和科学性。通过综合分析和研究,利用数据分类技术可以对教材的质量等级进行识别。同时,为了提高分类结果的准确性和分类的效率,对传统的K最近邻分类进行改进,先利用最短系统聚类法对教材样本进行聚类,然后对聚类后的小簇或孤立点使用K最近邻法进行分类,最终预测出教材的质量等级。论文主要讨论数据挖掘技术的研究背景和意义,结合本研究中利用的数据分类技术的实施过程,重点讨论常用的数据分类算法的特点和存在的问题,并联系教材质量评估的应用要求,选择一种合适的分类算法进行教材样本的分类。针对K最近邻(KNN)分类法具有较高的计算开销的问题,提出先利用最短系统聚类法.对样本进行预先聚类,然后再对聚类后的小簇或孤立点进行分类,极大地缩小分类样本的规模和数量,降低运算成本,进一步提高分类的效率。论文以教材数据为研究对象,分别从理论、算法和应用三个方面对教材质量等级分类进行研究。主要包括以下研究成果:首先,系统阐述了常用的数据分类算法,通过分析比较各自的优劣,重点研究KNN分类法,并总结出传统的KNN分类法存在的问题。详细研究了改进传统的KNN分类法的措施,提出先利用最短系统聚类法进行聚类然后再分类的KNN分类法,改进后的新方法能极大地提高分类效率。其次,将提出的新方法运用于教材质量评估中。通过对教材样本进行分类,能够预测出教材的质量等级,为教材的选取提供科学合理的依据。最后,通过实验分析科学地论证了新方法的优势。主要从关键参数选取、数据规模等方面对新方法执行效率的变化情况进行分析,展现出新方法较强的处理能力。
其他文献
本文介绍了我国社会可持续发展和生态环境建设对林业的重新定位,指出当今城市森林在林业的重要地位和生态建设中的首要地位。通过分析城市森林可持续经营理论的三个重要理论,
随着城市化进程的不断加快,农村也由传统的乡土社会向准熟人社会转变,农村的民事纠纷逐渐呈现出新的特点,传统的存在于农村的民事纠纷解决途径也逐渐没落。能否妥善解决农村的民
目的探讨玻璃体腔注射Lucentis治疗眼部新生血管性疾病的护理配合。方法收集年龄相关性黄斑变性、增殖性糖尿病视网膜病变和视网膜静脉阻塞导致眼部新生血管并接受玻璃体腔注
目的探讨中药保留灌肠治疗慢性肾功能衰竭的疗效及护理措施。方法对20例慢性肾功能衰竭患者进行中药保留灌肠及护理。结果 20例患者经治疗及护理,症状明显改善,各项指标有所
道路网络可靠性主要是针对路网进行事后的评价及分析,是衡量突发状况下交通系统功效的重要指标。随着我国城市化进程不断推进,城市道路的交通量迅速增加,交通系统的压力也越
目的探索基层社区绝经过渡期患压力性尿失禁女性早期干预的效果观察,提供最佳的防治措施,降低压力性尿失禁的发生。方法南山区三个街道的基层社区女性年龄在40~55岁之间共130
由于新时期我国畜牧农业企业形式发生了重大变化,外资企业进入、大中型畜牧养殖企业不断出现,各企业之间的市场集中程度进一步加强,所以国家和企业开始重视对畜牧农业企业资
在分析保罗.肯尼迪《大国的兴衰》的基础上,探讨了国家间的永续竞争,军事实力的刺激,经济上的发展态势,科学文化和国家的经济能力对大国兴衰的影响。指出保罗.肯尼迪的观点对
永升城基坑深井降水位于福州市内软土地区,面积约10000m2,开挖深度13m,围护桩四周透水,降水总涌水量达19000m3/d,基坑开挖深度及降水规模均列当时福建省同类工程之首。如何合
研究了喷雾干燥法制备高包埋率微胶囊化二丁基羟基甲苯(BHT)的壁材组成及工艺条件。结果表明,BHT/壁材为20%、阿拉伯胶/麦芽糊精为1∶3、海藻酸钠含量为0.6%、乳化温度为70℃