【摘 要】
:
机器学习中的生成模型(Generative Model,GM)用于对数据直接建模或作为条件概率密度函数的中间步骤。生成模型通常是概率性的,指定观测值和目标值(标签)之间的联合概率分布,可以通过贝叶斯概率形成条件分布。该模型假设所有数据都是由同一个潜在的模型生成,这个假设使得我们将未标记数据与学习目标联系在一起。典型的生成模型有:高斯混合模型(Gaussian Mixture Model,GMM),
论文部分内容阅读
机器学习中的生成模型(Generative Model,GM)用于对数据直接建模或作为条件概率密度函数的中间步骤。生成模型通常是概率性的,指定观测值和目标值(标签)之间的联合概率分布,可以通过贝叶斯概率形成条件分布。该模型假设所有数据都是由同一个潜在的模型生成,这个假设使得我们将未标记数据与学习目标联系在一起。典型的生成模型有:高斯混合模型(Gaussian Mixture Model,GMM),变分子编码(Variational Autoencoders,VAEs)和主题模型算法(Latent Dirichlet Allocation,LDA)等。在对数据进行概率生成模型建模时,对隐变量的先验概率分布的假设会影响模型对数据的拟合。为提高模型的灵活度和拟合度,对隐变量假设先验模型为混合模型是一种有效的方法。在本文中,研究者对GMM和VAEs的隐变量模型进行了改进,并提出 LGMG(Latent Gaussian-Multinomial Generative Model)模型。具体工作如下:第一,针对GMM模型,本文基于期望最大算法(Expectation Maximization Algorithm,EM)提出基于KS检验的高斯混合模型分裂与合并算法(KSGMM)。KSGMM算法以最小描述长度(Minimum Description Length,MDL)为目标函,平衡了数据拟合度与模型复杂度。以信息熵和KS检验对GMM中错误聚类的子模型进行判别,提高了对隐变量的估计精度。第二,针对VAEs模型,本文提出混合变分子编码(Mixture Variational Autoencoders,MVAEs)。MVAEs假设样本由混合模型生成,保留连续隐变量作为样本的隐层表示并引入了一个离散的隐变量。为实现对两个隐变量的变分贝叶斯估计,MAVEs利用多层神经网络学习隐变量的后验参数。结合重抽样技术和蒙特卡洛抽样方法实现了 MVAEs的随机梯度变分贝叶斯算法,并且在MNIST和OMNIGLOT数据库上对比分析了 MVAES、CVAEs、VAEs、SB-VAE、VAE_IAF 和 GMVAEs 算法的性能。第三,基于对离散隐变量的神经网络变分贝叶斯推理,本文提出了 LGMG(Latent Gaussian-Multinomial Generative Model,LGMG)模型。LGMG 是一个包含两种隐变量的三层贝叶斯模型,用来对图像语义标注信息建模。对比与传统的LDA-based模型和神经网络的方法,LGMG不需要手动的分割图像中的实例,而是用高斯隐变量概括图像的隐层语义信息。本文在LabelMe数据库上对比了 LGMG、tr-mmLDA、cLDA、VAEs和cVAEs模型的变分下界。
其他文献
保护投资者是我国证监会的根本使命,对投资者的保护有利于稳定金融市场、提高市场运行效率。在我国市场结构高度分散的情况下,中小投资者保护的问题更为突出,但我国作为新型
金黄色葡萄球菌(金葡菌)是一种分布非常广泛的食源性致病菌,可以对水产品、蔬菜以及肉制品等造成污染进而引发食物中毒,同时还可以引起多种人畜共患疾病,如化脓性肺炎、败血症和组织感染等,对公共卫生和安全造成极大的威胁。据报道,金葡菌可以分泌多种毒力蛋白,是其发挥致病性的主要原因,其中α-溶血素是最重要的毒力因子,可以破坏免疫系统而引起炎症反应,诱导单核巨噬细胞产生炎症因子并凋亡。同时金葡菌可以形成生物被
WL国际青年社区是一家连锁的长租式公寓,在中国租售并举的政策下,加快了长租式公寓的发展,同时也改变了一批消费者以租房替代买房的消费观念,由于我国长租公寓的发展属于起步
CDMA系统性能的好坏绝大程度上取决于扩频序列的相关特性,因此选择与设计具有良好相关特性的扩频序列至关重要。其中零相关区(ZCZ)互补序列在一定的时延范围内具有良好的相关
微机电捷联惯性导航系统(MEMS-SINS)具有低成本、体积小等优点,被广泛应用到无人机、行人导航等领域。而初始对准技术是捷联惯导系统最重要的关键技术之一。本文立足于行人导
随着时代的发展,多品种和小批量生产模式成为主流,而且客户的需求日趋多样化,企业间竞争也日益激烈,企业必须不断提升自身车间运作管理精细化和规范化水平才能在激烈的竞争中
近些年来,轨道角动量(OAM)复用技术作为一种全新的复用技术逐渐走进了人们的视野。利用不同拓扑荷的OAM模态之间互相正交的特点,研究者把OAM光束作为一种信息载体应用于复用
我国作为世界第二大经济体,尽管它是一个发展中国家,金融市场相对不成熟,但是我国的经济在过去30年里取得了显著的增长。与西方的自由放任的资本主义形成鲜明对比的是,中国政府在调控经济发展方面发挥着重要的作用。伴随着2008年的金融危机,各国政府纷纷采取各种经济措施,以巩固自身经济发展,避免类似的经济问题的再度发生。我国政府在此期间也出台了许多经济政策,以维护经济的稳定发展。2018年,中美贸易战的打响
随着科学技术的飞速发展,人们对智能化的需求越来越广泛,脑机接口(Brain Computer Interface,BCI)技术作为一种新型人机交互技术也随之从实验室走到了人们的视线之中,具有广阔的应用前景。但是脑电信号(Electroencephalogram,EEG)是一种非线性非平稳的信号,对脑电信号解析的难度较大。为了提高运动想象脑电信号的分类准确率以及脑机接口的实用性,本文选择多任务运动想
我国的并购基金市场兴起于2000年,由外资并购基金收购国有企业开始,但在之后的几年发展较为缓慢。近年来,伴随着政策推动、国企改革和新兴产业的迅速发展,越来越多的上市公司通过设立并购基金进行业务整合和产业升级,并购基金的形式和特征也更加多样化。目前,国内对于并购基金的研究主要集中在运作机制、设立动机和案例分析等方面,关于上市公司设立并购基金的影响因素和股价效应的研究较少,也鲜有从并购基金不同特征的角