高维复杂模式识别的新方法

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zboboz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现代科学技术的发展,需要对研究对象的特征有更深入全面的认识。因此,对模式识别技术的使用更加普及,而希望识别的问题更为复杂,这就使模式识别的应用领域不断地扩展,并推进了模式识别新理论和新方法的不断诞生。为了能更加精确、完整地描述对象,需要采用维数较大的模式。另一方面,由于对物性检测手段的现代化和多样化,在维数增大的同时,各自变量间的相关性也更为复杂。随着模式维数和复杂性的增加,各种降维映射方法和关联自变量与因变量的建模方法被引入模式识别领域,并越来越显示出它们的重要性,这也就是本文的研究重点。本文对自组织映射网络(SOM)学习算法和非线性映射方法(NLM)进行改进,并进一步提出了保留模式特征的映射算法,应用于高维复杂化学模式识别,获得良好的结果。此外,提出自适应偏最小二乘回归建模方法,并在实际应用中,获得良好的结果。在机理模型参数确定方面,提出了混沌遗传算法。本文的主要研究成果可归纳如下: 1)为了提高自组织映射网络(SOM)输出层神经元连接权矢量的利用率以及加快网络的收敛,并获得稳定的、保留拓扑特性的网络输出,设计了学习率,获胜领域以及充分利用连接权矢量的调整方案。对于学习率,为了反映出获胜领域各个神经元连接权矢量调整幅度的不同,提出了采用双重气泡函数。所设计的学习率变化随学习轮数总体上呈下降趋势的同时,使下降趋势呈一种波浪形式,即在某些学习轮数时学习率将有所增大。同时,获胜领域也随学习轮数不断阶梯式下降,并与学习率相配合,随着学习率的下降,处在该阶梯中的学习轮数将增大。为了充分利用连接权矢量,设计了在SOM网络的每一轮学习中,输出层每一个神经元最大的获胜次数。 2)在现有的非线性映射算法中,由于模式间的距离相互依赖,新添的模式无法直接映射到原有非线性映射平面上,而必须对添加新模式后的全部样本数据重新进行非线性映射计算,产生新的非线性映射平面。针对这种情况,提出了在原有非线性映射平面上添加一个新的映射点来产生新的二维映射平面,该映射点与原来样本中和新模式最接近的模式对应的映射点相同。然后,采用这个新的二维映射平面作为新样本的初始映射平面,进行非线性映射计算。由于最终获得的非线性映射平面与原有非线性映射平面几乎相同,因此采用这种方法可以快速、稳定地获得更新后样本的非线性映射平面。 3)在非线性映射算法中,为了获得良好的非线性映射结果,必须克服当映 浙江大学博士学位论文 射误差厂达到很小值时,仍有少数几个映射点之间距离与对应模式之间 的距离相差甚远的情况。对此,设计了自适应映射误差E算法,该算法 通过误差放大,克服个别映射点拓扑保留较差的情况,使每一个映射点 都能较好地反映各个模式在原始空间中的拓扑信息。 4)在非线性映射算法中,为了克服非线性映射结果对初始映射平面的依赖, 提出了一种类随机优化方法。它汲取遗传算法和模拟退火两种方法的优 点(随机性)以克服陷入局部最优点,但又不拘泥于某种分布,而能在 响应曲面的下降方向上前进,以加快寻优进程。 5)为了消除模式中有可能存在对描述模式特征无用甚至不利的自变量对映 射结果的干扰,以及消除自变量之间复共线性对映射结果的影响,使映 射结果能够反映模式特征,提出了保留模式特征的映射算法。首先从原 有自变量中提取特征变量,使提取的特征变量能保留原有自变量中尽可 能多的有用信息,同时使特征变量数尽可能地少,且特征变量之间要相 互独立。然后,将由这些特征变量组成的特征模式映射到低维空间。在 实际应用中又进一步提出了主成分特征映射算法和分类相关成分特征映 射算法,并设计了主成分特征映射分类器和分类相关成分特征映射分类 器。 6)提出一种自适应偏最小二乘回归(Adapting P洲ial Least Square Regresslon APLSR)建模方法。对于指定的预测对象,APLSR将根据模式在样本空 间中的分布,分析它们对预测对象的预报能力,自适应地为各个模式分 配权值,并从样本数据中提取和选定PLS成分,从而实施加权的PLSR, 以获得预报性能良好的模型。 7)将混饨变量引入遗传操作,设计一种混饨映射算子,进而构成混浊遗传 算法(Chaos Genetic Algorithm,CGAX 并用于机理模型的参数估计。 它基于混饨变量的遗传操作,将使子代个体均匀地分布于定义空间,从 而可避免早熟,同时遗传算法的收敛特性将会约束混饨变量,抑制其遍 历性,提高全局最优解的搜索效率,使CGA能以较快的速度和较高的概 率实现全局最优搜索,从而获得模型参数的最优估计值。
其他文献
生物医学成像仪器每天产生大量的图像数据。中国的数字人计划也已经获取了高分辨率、高质量的数据集。在这些来源不同的庞大数据中进行正常或病变组织、器官的定量分析与三维
数据挖掘是在海量的数据中提取隐含的、未知的、潜在有用的知识或信息模式的决策支持方法,是20世纪90年代初针对“数据丰富、知识贫乏”问题应运而生的一种新技术。为了有效地
地震勘探经历从二维、三维到如今的四维地震,这对地震勘探数据的传统二维解释方法提出了挑战,明显的不足就是没有充分利用三维或四维数据体所包含的信息,丢失了大量有用信息,造成
介绍了欧姆龙CQM1型PLC的串行接口的通讯协议,并针对烟支输送系统的实际,以VB6.0为开发工具实现了计算机与PLC的通讯。
随着网络技术的迅猛发展,开放式网络中的海量信息资源的规模和复杂度以指数级别增长,这对海量信息资源的智能化管理提出了更高的要求,需要解决信息资源的表示、信息资源的存
在新课程的理念下,只有对高中数学教学做出充分的调查、探讨、分析,才有可能提出合理的数学教学改革策略。优化作业设计无疑是使高中数学教学变得更有效的关键。
目的:探讨肺癌患者手术后心律失常的危险因素分析,以采取合适处理措施。方法对该院2003年1月至2012年3月收治的160例肺癌患者手术后心律失常进行回顾性分析,记录患者术后心律失
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
面部表情在人与人的交流方面传递着丰富的信息,因而可以通过面部表情分析去探究人的情感状态与认知状态方面的内容。面部表情分析可以为社交、教学、谈判、公安检察的刑侦、