凸分析在概率图模型中的应用

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aylylxs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
概率图模型(Graphical Model.Probabilistic Graphical Model)是一种结合概率论和图论,通过表示局部直接关联的条件概率刻画系统的有效工具,以其直观易懂的特点在数据处理中被广泛使用。然而随着概率节点的增多,系统的总体分析变得困难,推理通常也比较复杂。本文在正则化框架下,以凸分析为研究二具,研究监督、半监督和非监督情形下的概率图模型,形式化的目标函数简单,从而能够导出高效的推理算法:并且监督、半监督以及非监督之间的关系自然演进,能够统一在本文提供的正则化框架下;此外,设计在线算法求解正则化优化问题,能很好地平衡概率图模型的推理计算开销和泛化性能。我们首先研究多分类学习,设计的贝叶斯分类器的核心节点为输入样本特征赋予概率,标签和特征通过该概率赋值建立联系。基于对最大对数似然逻辑建立的优化问题进行分析,我们设计了计算开销极小的学习和预测方法,实验还证明该贝叶斯分类器在预测准确性和泛化性上都优于传统的多分类方法。我们的贝叶斯分类器兼具简单易懂、计算复杂性小、预测准确等优点。在半监督学习部分,我们设计了两个处理方法。第一个利用监督学习中贝叶斯分类器使用在线算法进行学习,且具有较快收敛速度和较好泛化性能的优点,让贝叶斯分类器为无标签数据预测类型标签,并将预测的类型标签和无标签数据组合在一起,用于训练。该方法是一个典型的探索-利用(Exploration-Exploitation)过程。第二个通过对贝叶斯分类器目标函数的分析,将之对应上以LogSumExp为目标函数的带约束优化问题,约束部分与类型标签有关,从而导出用LogSumExp处理元标签数据的基本框架,用于度量参数与特征数据结合的一致性。我们导出的这个框架能够覆盖k平均(k-means)方法,区别在于我们的模型基于乘积连接模型参数和无标签数据,而经典k-means使用L2距离。虽然我们在半监督学习中导出LogSumExp,但是需要说明的是该方法也可以用于非监督学习。LDA(Latent Dirichlet Allocation)和HDP(Hierarchical Dirichlet Processes)是经典的无监督自然语言处理模型。它的概率图描述中包含了大量与文本(甚至文本单词)关联的、需要进行优化处理的节点;这些节点描述概率图的局部条件依赖关系,缺少简单的整体性形式化优化问题定义,导致难以检测其合理性。在无监督学习部分,我们将LDA和HDP模型归约为正则优化问题。本文理论上的主要贡献包括:1.用LogSumExp处理无标签数据。我们对贝叶斯分类器处理标记数据的目标函数进行分析,导出了其具有定义Fenchel共轭函数使用的优化问题目标函数的形式;通过对约束优化问题和Fenchel共轭定义的关联,提取约束优化问题目标函数部分LogSumExp,将此作为处理非监督数据的框架。LogSumExp的导数为模型各个类型赋予不同的权重,以实现无类型标记时对学习的引导。2.将凸分析的对偶原理用于正则优化问题导出归约原理。归约原理将只含有一个优化元的正则化优化问题等价于包含多个变元的对偶问题,并且建立两个问题优化元间的关系式。基于归约原理,我们认识到模型中与序列有关的变元对应着只含一个参数优化问题的梯度,从而与大量序列变元有关的优化问题变成少量变元的优化问题。归约原理是建立概率图模型正则优化问题视图的基础,它也导出了任务"定义正则优化问题,以使得数据项梯度与给定概率图模型一致"。3.共辄函数定义对应一个优化问题,我们建立从共轭函数输入(对应优化问题参数)到优化问题解的映射。基于Fenchel不等式和共轭双射性,在函数严格凸时,我们得到从优化问题参数到优化问题极值的双射视图,在其中发挥作用的是原函数和共轭函数的梯度。因为梯度在关联参数和极值的重要作用,我们将这个性质称为梯度对偶原理。梯度对偶是我们定义正则优化问题正则项的理论基础。4.概率空间及其对偶空间。概率单纯形是概率图中的重要部件,在正则优化处理中需要处理参数和梯度(互为梯度对偶关系)的变换。通过对函数定义域结构的分析,使不能直接使用的梯度对偶原理在共轭函数<P∈概率单纯形.log(P)>和LogSumExp上成立,并将这两个共轭函数作为度量建立概率空间及其对偶空间。此外,我们通过LDA正则优化问题在线解法的分析,导出了概率空间的加和代数系统。
其他文献
近日,国家版权局指出,“黑洞图片”版权问题引发关注。国家版权局重视图片版权保护,依法维护著作权人合法权益。各图片公司要健全版权管理机制,规范版权运营,合法合理维权,不得滥用
报纸
基于可调谐激光吸收光谱技术(Tunable Diode Laser Absorption Spectroscopy,TDLAS)的气体检测系统在工业及日常生活中有着非常广泛的应用。不同的电流可激发可调谐激光器产
在历年高考中,许多地理试题以某区域为载体,考查相关的自然与人文地理特征,其中判断风向是高考的高频考点。在地理学科中,大气是一个非常活跃的自然地理要素,它与人类的生产
<正> 一、概述不同的矿物甚至不同含量的同一种矿物,在颜色和光泽上都有差异,人们可以利用这种差异将它们分选开来。1905年奥地利人就研制了光选机。由于对分选的速度和产品
对于几乎所有的黑白图像来说,加深和减淡操作都可以非常有效地控制气氛和细节,但是需要注意的是,真正的黑白摄影中,使用不同的胶片和冲洗工艺都会对最终画面的氛围和观感造成
美国政府对外政策的制定受到多种因素综合作用的影响,美国作为一个三权分立的国家,公众舆论是美国对华政策制定者们不得不考虑的因素。论文选取1933—1942年美国政府对华政策
阐述了温热物料振动筛的筛分原理和结构特点,并介绍了温热物料振动筛在沥青混合料搅拌站的应用效果。实践表明,温热物料振动筛填补了我国工程机械———路面机械的空白,可以
袁丽英在《南京社会科学》2010年第9期中撰文指出,我国职业教育投资由于受到多种内外部因素的影响,存在着体制缺陷、制度缺损、结构失衡等问题,造成了职业教育投资不足、效益
<正> 自1991年7月至1998年7月,我们共手术治疗髌骨骨折148例,其中复杂性(即严重粉碎性骨折,髌骨纵轴横轴都有骨折线)髌骨骨折32例,我们均用钢丝环扎加克氏针张力带治疗,取得
高职教育担负着为社会培养一线创新人才的重任。针对当前高职教育教学中对学生创新能力培养存在的问题,重点分析了创新能力培养的四个关键因素,提出了针对高职生创新能力培养