隐马氏模型距离的理论与应用

来源 :国防科技大学 | 被引量 : 1次 | 上传用户:a77115280
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
隐马氏模型(the Hidden Markov Models,简称HMM)作为一种统计模型,是由L.E.Baum和T.Petrie等人在上个世纪六十年代末七十年代初发展起来的。随后,它逐渐被应用到多个领域,如语音识别、基因关联分析和基因识别、文字识别、图象处理、目标跟踪和信号处理等。HMM理论主要包括三大问题:学习问题、识别问题和解码问题,其中学习问题(也称参数估计问题)是核心问题。本文主要讨论与HMM的参数估计和聚类问题密切相关的HMM距离的理论及其应用。 在参数估计问题中常常要用Baum-Welch重估计算法来优化参数。从理论上讲,每经过一次迭代,参数都得到优化,但实际上不可能无休止地计算下去,那么迭代到什么时候停止呢?这就需要定义一个距离来控制重估计的进程。同样,在HMM的聚类问题中也需要定义一个距离来进行模型分类。以前的文献提出了各种有意义的距离(如文献[1—10]),然而并没有一个规范的定义。最常用的是Juang和Rabiner在文献[2]中提出的距离(简称J-R距离),目前多数文献采用该距离或对其进行一些小的修改。但该距离存在两个明显缺点:一是采用蒙特卡洛方法来计算,其结果具有不确定性;二是收敛速度慢,计算量大,基至难以从数值上计算。本文在总结以前有关HMM距离的文献的基础上(其中还将Juang和Rabiner的一些直观论述加以严格的证明),从两个方向入手对HMM的距离进行了研究:一是寻求更快速有效的近似算法,二是引入一个新的更实用的距离。 本文的创新有以下几点: 1 对J-R距离的理论进行了完善,并用信息论中的相对熵对该距离作出了新的解释。 2 针对J-R距离在理论上很有意义,但实际上难以计算且结果具有不确定性的缺点,利用文献[11],得到了近似计算离散HMM和具有混合高斯观测密度的连续HMM距离的一种快速有效的算法,该算法用矩阵形式来表达,便于用MATLAB进行计算。 3 在给出并证明了离散HMM转化为齐次马氏链的一个定理的基础上,利用文献[12]研究动态聚类问题时所提出的马氏链之间的距离,定义了一个新的离散HMM的距离。与J-R距离相比,新距离是一个确定值且易于计算,最后经仿真实验表明该距离是合适的。
其他文献
本文对四元数矩阵方程的可解性作了一些研究,给出了几类四元数矩阵方程的可解性条件.对于四元数矩阵方程AX-XB=C,在已有结果基础上给出了一些推论.比如:设四元数矩阵方程AX-XB=C有唯一解,C是可逆矩阵,且ACBC-1=CBC-1A,则方程有可逆矩阵解的充要条件是AC-CB是可逆阵.可逆矩阵解存在时,其复表示为xX=xC(xAxC-xCxB)-1xC.关于四元数矩阵方程AX-XJB=C,XJ=-
本文研究并扩展了局部线性嵌入算法。局部线性嵌入算法是近年来提出的一种新颖高效的无监督的非线性降维技术,它能在良好地保持数据的局部几何结构和关系的情况下将高维数据投影到低维空间。算法的主要优点是易于执行、只需设置很少的参数并且是一种非迭代的算法,能避免陷入局部最小值。但是算法仍然存在很多需要完善和扩展的地方,比如:在数据中存在离群点的情况下如何使得算法更加稳健;在模式分类中算法如何与标签信息相结合来
本论文对炸药爆轰及水下爆炸的光滑粒子流体动力学(SPH)数值模拟方法进行了理论研究、程序设计和算例分析,主要工作和研究成果如下:1.调研了大量SPH方法的相关文献,掌握了SPH方法的基本理论和数值模拟程序的设计方法,并通过大量的程序实践,对SPH数值计算相关问题、SPH方法在应用中存在的缺陷和不足以及SPH方法的研究进展和发展趋势有了较好的了解;2.调研了炸药爆轰及水下爆炸方面的相关文献,对于炸药
高功率快放型锂离子电池是目前锂离子电池领域研究的重点方向之一.为了获得具有高功率密度的锂离子电池,正极材料须具有较高的电压和较高的电子与离子导电率,正极材料主要包括高电压钴酸锂、镍锰酸锂和高电压三元材料,负极材料包括碳系材料、钛基材料和金属氧化物材料,以及为提高首效和降低负极电位而采用的预嵌锂方法,并对锂离子电池电解液用锂盐、溶剂和添加剂进行了综述.最终总结了功率密度测试方法,并对高功率锂离子电池
非负矩阵分解(Non-negative Matrix Factorization,简称NMF)方法是一种新的降维方法,该方法具有可解释性、直观上的“局部构成整体”等特性,有着广泛的应用前景。本文针对NMF方法的初始化问题及其在中文文本挖掘中的应用,主要研究内容有:1、分析总结了NMF方法的理论体系对NMF方法的产生、发展过程、解析性质等方面的内容进行了研究,总结了该方法目前需要研究和解决的问题。研
量子信息是用量子态编码的信息,由于量子态本质上是空间非定域的,特别是量子态不同于经典物理态,具有非局域性,有些量子态还可能存在纠缠,这就使量子信息具有一些超出经典信息的新功能。深入研究非局域性不仅具有理论意义,而且对量子信息的物理实现具有指导作用。本文研究了量子信息基本理论中与非局域性有关的一个重要问题:量子态可分离性的判别。并提出了一个可分离态的几何图像:如果一个混态σ是可分离的,存在一个2nS
量子纠缠是量子信息科学最基本的资源,在量子隐形传态、量子密集编码、量子密钥分配和量子计算等方面都起着关键作用。研究表明,多粒子纠缠是研制具有超级计算能力的量子计算机的必备条件之一,因此一种新的多粒子特殊纠缠态——簇态,引起了人们的关注。量子隐形传态是实现量子通讯和量子计算的必要步骤,是量子纠缠的一种新颖而重要的应用。本文着重研究了基于腔量子电动力学(QED)的簇态的制备和量子隐形传送纠缠相干态的问
复杂储层中普遍存在孔隙度相近而渗透率差异较大的现象。为了揭示其原因,采用铸体薄片、核磁共振、CT扫描成像等实验评价孔隙的连通性。连通孔隙度是渗透率的一个主要贡献参数。因此,从岩石孔隙空间的导电机理出发,以导电孔隙度为桥梁,建立连通孔隙度的计算模型,并分析十二种不同类型岩石中连通孔隙度与总孔隙度的函数关系;基于连通孔隙度的计算模型,建立普适性的核磁共振T2模型;以石灰岩储层为例,在相近孔隙度条件下,
双曲型守恒律方程是一类拟线性方程,一般情况下,它们的解析解很难得到,这导致了此类方程数值方法的深入发展。自上个世纪五十年代以来,科学家们针对此类方程构造的数值方法已经取得了很大的成功,特别是后来TVD、ENO等格式的出现。考虑到双曲型守恒律方程的解只在很小的一部分区域会产生较大变形,因此局部自适应技术在此类方程中的应用也蓬勃发展起来。鉴于上述讨论,本文做了如下工作:1.在第二章,本文构造出了一个非
Steiner树问题是一个历史性的数学难题,在网络设计、VLSI设计等方面有广泛的应用。本文从平面上和赋权图上研究了关于Steiner树的几个问题。 文中首先讨论的是平面上的情形。由G-P猜想的获证知Steiner比为31/2/2,并且是可达到的。本文提出了正则点集的最大一最小比的概念,以此作为参数来描述正则点分布的均匀程度,并讨论了在给定正则点分布下的Steiner比,它可以大于31/2/