【摘 要】
:
半监督聚类分析是目前数据挖掘和机器学习领域中一个新的研究方向。一般,聚类方法针对的是无标签的数据,且无法利用先验知识或满足限制条件。然而,在许多聚类问题,问题本身往
论文部分内容阅读
半监督聚类分析是目前数据挖掘和机器学习领域中一个新的研究方向。一般,聚类方法针对的是无标签的数据,且无法利用先验知识或满足限制条件。然而,在许多聚类问题,问题本身往往带有约束条件且具有可利用的先验知识。比如学生寝室分配问题,寝室分配时必须符合最大容纳成员的数量限制。对于数据方面,也可以利用先验知识获得部分标签。此时,传统的聚类和分类方法都不能符合这类问题的要求。本文基于每个簇类的对象数量的限制条件,提出了适合寝室分配问题的K-均值半监督聚类算法,并通过matlab编程实现。然后,本文对聚类结果的稳定性和收敛性进行了分析,得出了各聚类方法准确率的期望和数据先验统计模型的关系。最后,基于贝叶斯统计分析理论,运用统计方法或经验引入了分布函数的先验知识。根据先验概率分布模型确定半监督算法中对应的后验分类流程。在三维高斯分布数据集的测试中,基于贝叶斯统计的k-means半监督聚类准确率为93.67%高于k-means方法的91.67%的准确率。
其他文献
本研究旨在阐明阿富汗的国内和地缘政治特征如何导致美国反叛乱政策的困境。美国入侵阿富汗是为了打败恐怖主义,保护人民,建立民主政府。但相比之下,这些年来,恐怖组织不仅没
城市发展战略规划是全面综合安排和协调对城市长期发展具有重大影响要素的实践活动,它将城市经济社会整体发展的战略与城市空间扩展模式紧密结合,是对城市未来发展方向做出的宏观安排,引领着城市未来发展的总体方向。我国的城市战略规划研究伴随着城市化的发展进程,在学术研究中多集中在战略规划理论与内容、技术流程的分析,实践案例的研究多选取以广州等沿海城市为主,对于西部地区的涉足较少。西安作为西部城市的代表,其发展
色彩是绘画的重要语言,即使在构图、内容和线条都相同的情况下,不同明度和纯度的色彩,以及不同的色彩搭配都会给人带来不同的感受。笔者用熟宣作为基底材料进行创作,以色彩对
列车的运行速度不断的提高使得复杂多变的运营环境更加严峻,列车空气动力学性能是提高列车运行速度的关键因素之一,而转向架裙板结构(裙板和支架)在保护转向架区域设备的同时,也对列车的空气动力学性能有着一定的改善作用。裙板结构(裙板和支架)除了承受整体的振动与冲击载荷外,还承受运行过程中作用于裙板上剧烈变化的气动载荷,而列车运行速度的提高导致各种载荷的增大,进而使得裙板结构(裙板和支架)发生疲劳失效的可能
常规的空间探测器的波段多为可见光与红外波段,而可见光波段的探测器往往只能在白天工作,因为夜晚时由于传感器灵敏度的限制可见光难以观测。随着微光探测器的发展,星载微光
作为清初浙东学派重要人物之一,邵廷采不仅在学术上有突出的成就,在文学上也有独特造诣,而其文学实即学术的外化。本文共分四章。第一章从四个方面回顾梳理明清之际浙东学术之演化过程。一是浙东理学的传播。浙东理学以阳明心学为重点,钱德洪、刘宗周接踵其后。其后明清之际的姚江书院派以宣传阳明学说为己任。邵廷采之父、祖包括他本人皆为姚江书院派弟子。二是经世实学的流衍。在浙东,晚明以来的经世思潮一直持续至于清初。浙
在二语学习中,词汇学习贯穿始终,对整个学习过程起到重要作用。本文立足于学生的口语产出性词汇,研究这些词汇中的词汇广度知识。本文研究对象为中级水平班的29名留学生,学生
改革开放以来,我国农村劳动力开始大规模向城市流动,以务工的方式在城乡之间来回流动。农民工不断体会着城市社会的特征并且被迫或主动地去追求城市中的新文化,以“城里人”
随着时代的发展,国家的昌盛,充满浓厚时代气息的音乐作品如雨后春笋般大量涌现,二胡协奏曲《红梅随想曲》由作曲家吴厚元先生根据歌剧《江姐》改编而作,本文主要以《红梅随想曲》中演奏技法的使用和选择上的不同来诠释作品的魅力,从而深入探究作曲家赋予“江姐”的音乐形象及人物气质,将人物深层次的内心、性格以及音乐的深层含义充分表现出来,为今后演奏及分析理解作品方面起到很好的理论铺垫作用。对于这种带有红色革命素材
随着幼儿园课程改革的不断发展,幼儿教师课程领导力逐渐受到重视,但在实践中由于各种内外部因素的影响使得幼儿教师课程领导力难以得到提升。专家型教师作为教师发展的理想目标,具有相对成熟的课程领导力且其课程领导力的发展经验能够为其他教师带来启示。因此,对专家型幼儿教师课程领导力展开研究具有一定的现实意义与价值。本研究采用个案研究法,选取S园的三名专家型幼儿教师为研究对象,运用访谈法收集资料,利用类属分析与