基于GMM的EM优化算法的应用与研究

来源 :哈尔滨工程大学 | 被引量 : 0次 | 上传用户:luoyuqingyuan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能领域的不断发展,聚类分析的应用越来越广泛,其主要功能是对数据进行合理地归类,进而将数据分类到不同的簇。高斯混合模型(Gaussian mixture model,GMM)通过学习出一些概率密度函数的方式,将每个样本数据点被划分到各个簇的可能性通过概率的方式体现,这种聚类方式称为软聚类。GMM主要应用于智能交通控制系统、运动目标检测、图像识别、辅助驾驶系统等领域。GMM通过对样本的概率密度分布进行估计,同时使用期望最大化算法(Expectation Maximization,EM)进行训练。但高斯混合模型的EM算法仍存在着算法本身的不足,严重影响了聚类的质量。本文针对高斯混合模型的EM算法当前主要两点不足,即数据初始化敏感问题和局部收敛问题展开分析并提出相应的改进方法。首先,针对高斯混合模型对数据初始值敏感的问题,本文采用层次聚类算法,对高斯混合模型的参数进行预处理。其次,针对高斯混合模型的EM算法对混合模型参数进行估计时,得到的估计参数很大概率上为局部最优解,影响了高斯混合模型最终的聚类结果。本文利用近似骨架理论弥补其局部收敛的不足。近似骨架可以捕获多个局部最优解,通过将近似骨架运用于聚类算法的设计中,求解出全局最优解,从而避免了GMM处理大批量数据集时产生局部收敛问题,得到的估计参数将最为拟合样本数据集的分布情况。最后,本文将基于高斯混合模型的EM算法优化后的聚类算法投入到空间索引的具体应用中。而空间索引技术的应用日益广泛,R*-树作为其重要的一种空间索引结构,仍存在最小外包矩形重叠的缺陷。本文利用优化后的高斯混合模型聚类算法对R*-tree进行重新构建,有效地减少了最小外包矩形的重叠率,加强了属性之间的相似性,减少了查询到目标对象的路径数目,同时缩短了搜索时间,提高了空间索引效率。
其他文献
随着现代涂层技术的不断发展,涂层材料的应用越来越广泛。研究涂层/基体系统的断裂力学强度,不仅具有理论意义,同时为涂层材料的设计和制备建立分析基础。本论文采用有限元系统AN
2004年2月15日午间,一场大火在吉林省吉林市中百商厦熊熊燃烧起来。红色的火魔卷起滚滚浓烟,毫不留情地夺去了54人的生命,70人在持续4个小时的大火中受伤。省长道歉面对这场
第一部分基于扩增子高通量半导体测序技术的肺纤维化基因诊断方法的建立研究目的:特发性肺纤维化是一类病因不明确的进展性肺间质性疾病,缺乏有效的早期诊断手段,确诊后往往
随着改革开放的进行,我国的经济得到了发展,法治建设也处于不断的进行之中,而我国的社会主义市场经济体制也在不断地发展完善。当然,行政法治建设也得到了极大的完善,而政府
去徽杭古道完全是一时兴起:那是一个百无聊赖的周五,等着下班的我正寻思着如何打发即将到来的周末。在西祠户外版闲逛,发现有俱乐部组织去徽杭古道和清凉峰。打出的口号是行
随着运行年限的增长,某天然气场站埋地管道腐蚀风险逐年增大,为降低管道泄漏风险,采取直接检测法、试片断电法和超声导波检测技术对埋地管道防腐层、区域阴极保护效果、管体
对杭州湘湖剖面高密度连续采集的样品,分析了Fe2O3、FeO、TiO2、CaCO3、Al2O3及Fe2O3/FeO比值的高分辨记录,发现它们对全新世的重要地层界面都有较清晰的反映,同时揭示了不同
P2P网络借贷的发展是现代金融领域的一大创新,符合社会发展的需要。这一创新产物促进了我国金融领域的发展,其一方面使得民间的资金有了更为高效的投资平台,另一方面当前我国
针对遗传算法在后期收敛速度慢不适于在线优化的缺点,提出了一类改进遗传算法与可变容差算法相结合的在线分层优化算法,开展了发动机最大推力模式、最小油耗模式及最低涡轮前
高职院校要坚持内涵式发展,提高人才培养质量,师资队伍多元构成与协同创新建设成为关键。针对当前高职院校师资队伍建设存在的专业知识与职业技能的不对称性、教学活动与专业