基于认知的信息模式测度与特征压缩算法研究

来源 :中国科学院计算技术研究所 | 被引量 : 0次 | 上传用户:xujiaaiwu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文就模式识别的第一次映射为研究对象,建立基于认知的信息模式测度与特征压缩算法。其主要研究内容包括以下四个方面: 1、信息模式测度(IPM)理论研究。 介绍了信息的基本概念及其基本性质,讨论了离散信源及其信息测度、连续信源及其信息测度。然后在现有模式测度理论基础上,基于交互熵理论,提出了对称交互熵(SCE)的概念,建立了交互距离测度(CDM)理论;同样基于信息论,提出了多项式熵(PE)的概念,并对PE进行了改进,提出了改进多项式熵(IPE)的概念,由此建立了一种新的多项式熵测度(PEM)理论:以平均互信息量或公共信息量为基础,提出了相关信息系数(CIC)的概念,以此为基础,建立了相关信息测度(CIM)理论;以平均互信息量、联合熵为基础,构造并论证了一种新的距离测度,从而建立了信息距离测度(IDM)理论;讨论了离散量的概念与性质,在此基础上建立离散增量测度,进一步建立广义信息距离测度。 2、模糊信息测度(FIM)理论研究。 在分析现有模糊集理论的基础上,基于模糊信息论,对两个模糊矢量之间的测度理论问题进行了进一步的研究。讨论了模糊熵理论,提出了模糊公息(FMI)、模糊相对公息(FAMI)、模糊相对公息(FRM),进而建立了模糊绝对熵测度(FAEM)、模糊相对熵测度(FREM)等理论;基于Shannon交互熵理论,建立了模糊交互熵(FCE)的概念,并针对FCE的不足,提出了对称模糊交互熵(SFCE)的概念,由此建立了模糊交互熵测度(FCEM);在对模糊似然测度(FLM)公理化理论分析的基础上,建立了一种新型的模糊似然函数——对称模糊子集度(SFSD),以刻画两模糊集之间的相近程度。 3、无监督信息特征压缩(UIFC)理论研究。 讨论了主成分分析(PCA)的基本原理,基于信息熵理论,研究了PCA的信息特性,为信息特征优化压缩奠定了理论基础;基于Shannon的可能性理论,根据PCA的基本思想,尤其是本征值的内在特性分析,提出可能性信息函数(IFP)的概念,用以度量本征值的内在特性,提出了可能信息率(IRP)和累计可能信息率(AIRP)概念,用它度量了信息压缩的程度,由此建立了改进PCA算法(IPCA算法);将偏最小二乘(PLS)回归引入到信息特征压缩领域,提出了基于PLS的信息特征压缩算法。该算法在对解释变量数据集进行压缩的同时,顾及了与预测变量的相关程度,其压缩结果较传统的主成分分析(PCA)、主成分回归(PCR)具有更大的优越性,尤其当解释变量多,而样本量少时很有效,且更有理论意义与实际意义;讨论了两维显示问题,建立了基于两维显示的信息特征压缩算法。 4、有监督信息特征压缩(SIFC)理论研究。 对类别可分性判据(CSC)的基本概念、基本性质研究分析的基础上,基于信息论,讨论了一种新的类别可分性判据……散度准则(DC),讨论并证明了DC的基本性质,尤其是“距离”度量性质,建立了基于DC的信息特征压缩算法。基于信息熵理论,建立了信息熵准则(IEC),用于度量两个后验概率分布的可分性程度,并给出了几种IEC判据。在分析研究IEC判据的基础上,且类概率密度函数服从正态分布时,建立了一种基于IEC的信息特征压缩算法;基于交互熵理论,构造了对称交互熵(SCE),并证明了它是一个距离度量测度。进一步为应用方便,提出了多项式熵(PE),进而构造了一种新的距离度量测度……改进的对称多项式熵(ISPE)准则。基于ISPE,建立了一种新的有监督信息特征压缩算法,同时,将ISPE准则进行了改进,构造了平均ISPE(AISPE),建立了一种推广的基于ISPE的信息特征压缩算法;在对白化变换及其相关概念的分析的基础上,建立了基于散布矩阵+DKLT的信息特征最优特征压缩算法;同时介绍了同时对角化的基本概念,建立了应用白化变换、正交变换将两个对称矩阵同时对角化的基本步骤,在此基础上,建立了基于同时对角化的一种简化最优特征压缩算法,并进行了实际应用。
其他文献
随着互联网与信息化技术的迅速发展,社会网络逐渐普及,越来越多的人们在网上共享数据并参与各种各样的活动。社会网络的出现无疑给人们的沟通与娱乐提供了及其广阔的平台,但
工作流系统成功的关键在于向其输入的工作流的质量。因此,工作流建模成为当今工作流研究的一个热点问题。 工作流管理联盟(Workflow Management Coalition,WfMC)将整个工
随着Internet的迅速发展,网络信息不断膨胀。为了提供高效、准确的信息服务,我们需要对网络中繁杂的信息进行合理的组织与分类。本文的目标就是以HTML文本信息处理为背景,从理论
随着网络技术的迅猛发展,网上的信息数量成指数级别增长,如何有效组织、检索、处理这些信息成为当前研究的重要课题。信息检索是指从海量文本信息中找到与给定信息需求想关的一
本文主要研究模糊控制过程中输入输出论域的伸缩变化对控制性能的影响以及如何利用论域的变化提高控制性能。分析并总结控制参数(量化、比例因子、规范化因子(Scaling factors))在控制中的变论域作用,指出这些参数与变论域伸缩因子的关系,并通过大量仿真实例说明以上参数通过伸缩论域对控制性能的影响。 针对模糊控制过程中基本论域范围确定的难题,提出用模糊规则描述控制过程中输入输出论域应遵循的伸
近年来,随着社会经济的发展不断增速、人们生活节奏日益加快和生活水平的逐步提高,心理健康不但对人生的幸福和成就有着极大的影响,而且心理健康及其衍生的系列问题对构建和
在电子商务蓬勃发展的今天,跨国集团、企业内部、企业与企业之间的相互合作和交流成为了每个企业的内在需求。企业在信息化的建设过程中,由于规划的非全面性、技术的局限性,造成
P2P网络是近年来业界研究与关注的一个焦点,它在很多领域都得到了应用,未来发展空间很大。但是,P2P网络发展过程中,也产生了一系列急需研究和解决的问题,安全就是其中最重要
多智能体系统,是近年来人工智能领域的重要研究方向之一。RoboCup作为典型的多智能体系统,其期望通过提供一个标准问题,鼓励人工智能及智能机器人领域的研究人员,充分利用各种有
高校人才的引进对学校的发展十分重要,传统的人才识别方式是通过考察引进人员的定性指标实现的,依靠手工操作很难保证识别结果的全面性、科学性和准确性。鉴于许多高校都建立了