结合监督信息的狄利克雷混合模型及其应用

来源 :宁波大学 | 被引量 : 0次 | 上传用户:Mr_Law
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习是人工智能领域重要的议题之一,广泛的应用于视频、图像、生物信息处理、系统控制等领域。在传统的机器学习中,各类机器学习模型依据学习过程的不同被分为监督学习和非监督学习两种相异的数据处理方法。在监督学习中,系统根据大量的标签样本学习得到具有优良模型泛化能力的分类器,然后利用该分类器对未知样本进行类别标记;非监督学习则根据模型假设对无标签样本进行非标签聚类,从而得到样本间的相互关系。比较两类方法可以发现,监督学习方法虽然分类准确,但数据标签的标定耗时耗力,而非监督方法虽然具有省时省力等多方面的优点,但由于指导信息的缺失,导致其对数据的归类效果不理想。为此,如何将监督方法与非监督方法结合,设计一种半监督聚类方法,从而结合非监督方法的各自优点已成为当下研究的重点问题之一。  为解决上述问题,本文首先引入狄利克雷混合模型(Dirichlet Process Mixture Model,DPMM)。该模型是一种在数据分析中具有良好类别估算和概率表达能力的聚类模型,具有建模能力强大、模型可扩展性好等突出优点,因此被广泛的应用处理各类复杂的概率建模问题。抛开这类模型优势,DPMM聚类结果受数据复杂度的影响较大,聚类能力容易随聚类样本复杂度的增加而下降。针对这类问题,本文首先结合少量监督信息,提出一种结合监督学习的半监督狄利克雷混合模型(Semi-supervised Dirichlet Process Mixture Model,SDPMM),然后针对此框架推导了估算后验概率的变分推理算法。最后为验证本文方法的聚类精确度,本文首先将 SDPMM方法应用于人工数据集、UCI机器学习数据集,实验结果表明,监督方法的引入在使得样本的复杂度降低的同时,可以有效提高DPMM的聚类性能。最后,为进一步扩展本文方法的实用性,结合一类新设计的叶片形状描述方法,将SDPMM方法应用于叶片的聚类和分类实验中。
其他文献
学位
随着DSP芯片的快速更新,其硬件性能得到了飞速提升,但DSP芯片中的ZSP系列还没有得到主流编译器的支持,以至于无法用这些编译器对在这些嵌入式芯片上运行的代码进行优化处理,从而
学位
相对于传统的磁盘,固态盘具有读写速度快、能耗低、抗震性好和噪音小等优点,随着闪存芯片价格的不断降低,固态盘已经广泛应用于各行各业。如何进一步提高固态盘的性能,充分发挥固
随着现代企业对数字化信息处理的依赖,企业数据已经成为企业的重要商业资产,数据备份技术的研究一直是存储厂商研究的重点。企业所有用户的数据都采用统一的数据备份策略并不
视频监控系统在安全防范和现代化管理中的应用愈加广泛,对特定场合的相关视频事件进行智能分析的需求越来越大。目前,国内外研究基于内容的视频检索取证系统较多,而将取证与事件
随着我国经济的高速发展,空中运输需求量持续上升,由此带来了我国航空运输业的兴起和快速发展。由于空中交通流量的激增,我国现有的航空运输设备和管理技术变得难以适应;在空中交
分子动力学模拟是指对由原子所构成的系统,用计算机模拟原子的运动过程,从而计算出系统的结构和性质,是在物质微观领域评估和预测材料结构和性质的一种重要模拟方法。在实际的模
无线传感器网络是一种在没有固定基础设施的环境下构建的由传感器节点临时组成的自组织无线网络,节点的能量供应、计算能力和通信能力等资源都非常有限,所以如何延长网络的生存
随着计算机网络和虚拟现实技术的不断发展和结合,虚拟现实技术得到广泛的应用,其成为当前热门课题。虚拟现实技术在三维企业导览系统中的研究和应用,为现实与虚拟世界架起一