面向大规模数据分类问题的监督学习算法研究与并行应用

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:num184015922
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着科学技术的迅猛发展,产生了各行各业都在迅速产生海量数据的社会现象,导致了人们逐渐开始思考该如何最大化且最有效地使用这些数据。机器学习(Machine Learning)与深度学习(Deep Learning)技术异军突起,分类算法作为机器学习与深度学习最典型的应用方式,迅速成为了业界与学术界争相努力的研究方向,该如何建立一个高效普适的分类模型这一问题开始显得意义重大起来。此外,由于计算机处理能力的限制,分布式的并行计算框架(Distributed Parallel Computing Framework)也开始逐渐进入人们的视线,针对不同的算法搭建出最合理的并行计算框架也逐渐成为一个新兴的研究课题。为顺应这些技术需求,本文提出了从设计机器学习改进模型、使用高效率优化方法,到应用优化算法于并行计算的整套完整流程。本文的主要研究是基于机器学习中的监督学习多分类问题。即在有类标的训练集合上建立分类模型,拟合出模型的参数,用于预测未知类标的测试集合上的标签的方法。本文首先提出了一种将类标的量化取值设置为k-1维欧式空间上k个顶点的坐标来建模的方式,并在模型中加入降噪函数与合适的惩罚项,建立了一个新的线性多分类模型。在建立模型之后,本文引用了几个强大的有约束以及无约束的优化算法,对模型进行优化求解。此后,本文还针对算法,设计了并行框架,大大提高了分类器的运行速效率。研究内容包括以下几个部分:(1)本文建立了一个新的针对多分类问题的线性分类器模型。模型中的标签设置方式引入了顶点判别分析法(Vertex Discriminant Analysis,VDA),一种处理多个类别以及超过训练用例的预测因子的标签设置方法,使模型在多分类问题的情形下具有更均匀分布的标签。此外,模型还使用ε-不敏感函数这一常用的降噪函数,使得本文模型对噪声数据下的过拟合现象以及数据采样有误差等问题有着最直观的效果。(2)在模型的优化过程中,本文使用了几个简单且强大的有约束条件与无约束条件的优化算法。本文分别使用了Forward-backward splitting与FISTA算法在无约束条件优化问题中对本文的不光滑函数凸模型进行优化,获得迭代步骤。本文也使用了ADMM算法将本文模型转化为有约束条件的凸模型并进行优化,获得迭代步骤。在数值实验中本文的模型与优化算法获得一些引人瞩目的结果。(3)本文的另一项工作在于将本文采用的模型使用分治法(Divide and Conquer method)的思想将算法的母问题分解成子问题并分治地求解,设计了基于ADMM的并行优化框架,并在MPI与openMP的混合环境下加以实现,这一计算框架获取了可观的计算性能加速提升。
其他文献
省府2014年11月份任命:李贻伟 广东省人民政府副秘书长丘瑞清 广东省质量技术监督局副局长黄德发 广东省地质局局长
摘 要:本文从确定专业教学的基本知识架构、强调教学实施中实践技能的培训、突显实操环节这三方面谈了中职数控教学的启示。指出只要我们坚持以就业为导向,以全面素质为基础,以能力为本位,突出职业能力,加强实践教学,就把握住了数控专业建设的方向。  关键词:中职数控教学;教学启示  在中职学校中,我作为专职教师担任数控、机电专业的相关课程的教学工作。学校为了提高教师的业务水平,每学期都定期举行培训,从思想认
由于各种围生期因素引起缺氧和脑血流减少而导致胎儿和新生儿的脑损伤,多见足月儿,是导致儿童神经系统伤残的常见原因之一.因此掌握精湛的医术与合理的精心护理,对抢救患儿生
胃癌穿孔是胃癌的一种严重的并发症,我院近5年110例胃十二指肠穿孔中,胃癌穿孔5例,占胃穿孔4%.胃癌穿孔特点是穿孔面积大,周围胃癌性组织,质地硬,不易封闭,腹膜炎体症较重.
新课标教学中明确提出:“提高学生的基本地理素养”。我们在日常地理教学中要将理论知识与我们的现实生活尽可能多的联系在一起,让学生们树立可持续发展观念,增强理论联系实际的
各地级以上市人民政府,各县(市、区)人民政府,省政府各部门、各直属机构:经省人民政府同意,现将《关于在我省开展排污权有偿使用和交易试点工作的实施意见》印发给你们,请认真遵照执
一则情理交融、激励性很强的评语,一段肯定、称颂的赞美之词,会改变一个人的一生。如果教师能巧妙地运用这些激励的方法去赏识学生,那么学生就会心情愉悦、精神爽朗,这种参与研究型激励教学的手段往往会达到事半功倍的效果。  “好孩子是夸出来的,好学生是表扬出来的”,表扬是激励学生形成良好行为习惯的最好手段。表扬也需要讲究策略,否则不但效果不好,还可能形成另一种伤害。  一、要表扬学生的行为而不是人格  对人
各地级以上市环保局、深圳市人居环境委、顺德区环境运输和城市管理局:固体废物信息化管理是推进危险废物规范化管理的重要抓手,是提高行政效率、减少廉政风险的重要手段。为进
目前,E36高强钢在海洋工程导管架结构中广泛应用,其在焊接施工中的冷裂纹问题较为突出。其中,因管节点冷裂纹的滞后性导致的危害尤为严重。因此,如何定量地确定钢材焊接接头