分布式Logistic回归方法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:cs8613416
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文首先研究分布式Logistic回归处理存储在不同链接计算机中的海量数据,基于交替方向乘子(ADMM)算法,我们将Logistic问题的求解转化为多步迭代过程,并提出了一种通信成本可控的分布式Logistic算法.特别地,在分布式算法的每次迭代中,每台计算机都会更新局部估计量,并同时与邻居交互局部估计量.我们随后证明了分布式Logistic算法的收敛性,由于计算机网络的分散性,因此提出的分布式Logistic算法是鲁棒的,且分布式Logistic方法的分类结果与非分布式方法相同.实验表明,我们的方法既有效又高效,在分布式海量数据分析中表现良好.随后我们研究了具有差分隐私的Lasso方法.由于Lasso的不稳定性,无法直接将差分隐私框架引入Lasso,我们基于函数机制开展基扰动Lasso研究,并利用ADMM算法求解.特别地,在ADMM算法的每次迭代中,只有一步会直接访问数据集,我们仅在该步的求解过程中加入噪声,使得新算法满足差分隐私.当所需分析的数据集样本量大,维度低时,即使隐私预算很小,差分隐私Lasso方法的选择结果与Lasso方法的结果相近.随着数据维度的上升,隐私预算也需随着增大,此时差分隐私Lasso方法的选择结果才和Lasso方法的结果相近.当样本量过小,差分隐私Lasso则无法完成变量选择的任务.实验表明了差分隐私Lasso方法在处理大规模数据时的有效性.
其他文献
大数据不仅是一场技术革命和经济变革,更是一场国家治理的变革。大数据时代的到来,使得人们的工作、生活和思维方式发生转变,同时也使得党员干部思想、作风、纪律方面的问题线索变得更加多样化、智能化和隐蔽性,由此倒逼党内监督方式发生变革。巡视巡察作为党内监督的一种方式,通过利用大数据技术,推动巡视巡察工作发现问题更加精准、分析问题更加深入、解决问题更加有效,从而提高巡视巡察工作的质量和效率,充分彰显新时代巡
学位
随着高等教育的普及,公民的纳税人意识越来越强。在建设服务型政府的目标引领下,税务机关的管理逐步向服务化方向发展,通过提供更准确、方便、高效、优质的服务,努力提高税务机关的公信力,提升纳税遵从度,建设服务型税务机关。  研究公民对税务局所提供纳税服务的满意度问题,对于保税基、增强纳税遵从度、构建和谐征纳关系具有重要的意义,成为建设服务型政府的重要一环。但税收本身的强制性、无偿性和固定性三大性质与致使
学位
学位
There are several articles written about how to enter into the Chinese market,how difficult it is to adapt to Chinese business culture and how to succeed in the Chinese market.However there is very li
当代我国的经济正处于“新常态”的环境中,我国经济的发展较以前相比,其发展速度变缓,而工业化初期所带来的经济加速增长的福利正在逐渐的削弱,我国经济已全面进入“结构性减速”的时代。在新常态下,寻找新的经济发展动力就显得愈发的重要。已有学者通过研究表明,在经济的发展过程中,产业结构的升级可以作为其更进一步发展的主要动力,因此各个国家都在寻求利用产业结构升级的方法,来实现国民经济的持续稳定增长,这已经上升
实体经济是中国发展的重要支柱和强大动力,保持实体经济持续增长是推动中国经济健康发展的基本要求。然而,在当前中国经济下行、经济进入新常态的情况下,实体经济的回报率低、周期长,而金融行业的利润率高、周期短,这使得大量资本流入金融部门,造成金融虚假繁荣、经济泡沫化严重的现象。  数字普惠金融是指一切采用数字技术促进普惠金融的行动,其在互联网技术的基础上与金融相结合,产生了诸多创新的金融业态。数字普惠金融
改革开放四十年以来,中国的经济取得了飞速的发展,2018年全年国内生产总值900390万亿元,人均年收入9732美元,高于中等收入国家的平均水平。但是高速度的经济增长是通过过度依赖能源和资源消耗形成的高投入、高能耗、高污染、低效率的生产方式来实现的。2017年在全国388个地级及以上城市中,仅有99个城市环境空气质量达标。国内各城市PM2.5和PM10年均浓度分别为44μg/m3和80μg/m3,
学位
城镇化发展背景下新消费革命的来临和社会投资战略的转型推动大城市郊区多数乡村旅游目的地的产生。城郊型村庄作为旅游发展最为活跃的地区之一,其社会文化、经济效益以及生态环境多个方面受到深刻影响,人地系统遭遇剧烈变迁,由此引发的人地交互作用尤其明显。因此,探明乡村地区对旅游开发多重效应的响应,是促进目的地可持续水平的重要途径。本文构建农户尺度的旅游乡村社会—生态系统,确定农户适应性的分析框架、路径方法和概
信息技术和社交媒体的发展给诸多领域带来了大量数据,这些数据能够抽象出网络结构,反映出复杂系统的特性。作为复杂系统基本单元的节点,通过某种关系连接到一起,产生了相互作用并构成了复杂网络。挖掘网络数据背后的潜在信息,成为亟待解决的重要问题。许多机器学习技术的进步,为自动学习网络节点的向量表示提供了可能。  本学位论文针对复杂网络的表示学习问题展开研究。主要目的是将网络中的节点表示成低维实值的向量形式,
学位