分类器设计及组合技术研究

被引量 : 0次 | 上传用户:yanyingguilai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在人工智能领域,模式识别是一个非常重要的方面。模式识别系统主要分为两部分:第一部分从输入模式中提取用户需要的特征,实现模式到特征的转换;第二部分是根据所选取的特征度量进行分类的问题,即决策问题,实现把输入模式指定到某一类中。本文就如何提高识别性能对模式识别系统的第二部分进行了研究。本文首先对最小距离分类器模式识别方法进行分析和研究,提出其存在的缺点。在最小距离分类器中,通过对欧氏距离度量的分析,引入自适应距离度量,提出了基于自适应距离度量的分类器设计方法。首先利用训练样本建立自适应距离度量模型,该模型保证了训练样本到相同模式类的距离最近,到不同模式类的距离最远,根据该模型建立目标函数,求解目标函数,得到一组最优权重。在分类时,应用最优权重进行加权定义,从而获得更好的识别效果。但是单一分类器由于其采用的特征类型单一性以及自身的局限性,改进的距离度量尽管在一定程度上提高了识别性能,但是这种提高有限。研究表明,不同分类器在识别性能上有互补作用,因此如何把各种分类器结合在一起,从而能够集成各个分类器的优点,而抑制它们的缺点,是提高识别性能的关键,本文对多分类器组合进行了研究。多分类器组合主要分为并联与级联两种方法,本文对多分类器组合的这两种方法进行研究,首先应用Bagging技术,将本文设计的基于自适应距离度量的分类器进行集成(并联组合),提出了一种基于自适应距离度量的最小距离分类器集成方法。另外,本文通过对最小距离分类器和支持向量机进行研究,充分利用MDC和SVM的优点,提出了一种将最小距离分类器和支持向量机分类相结合的方法,形成了一种新的分类器。首先用最小距离分类器进行分类,找到待识别样本到样本均值的最近邻和次近邻,根据最近邻和次近邻定义可信度,如果可信度大于预先设定的分类阈值,则待分类模式直接用MDC进行分类;否则,用最近邻和次近邻所对应的训练样本训练SVM,用SVM对它进行分类。本文在实验中,采用UCI标准数据集进行实验,结果表明本文提到的方法都是有效的。
其他文献
2016年,餐饮业已经成为国务院消费升级的十大行业之一。徐州地区餐饮业发展势头强劲,同时也存在诸多的问题和挑战。本文以问卷调查的方式进行研究,对调查结果进行分析提炼,了
仲裁是一种古老的争议解决方式。18世纪末,由于国际商事交易的发展和国际商事纠纷的增多,仲裁开始被应用于国际商事领域,形成了区别于国内商事仲裁的国际商事仲裁,并因其中立公正
目的:观察败酱草合剂联合密波电针治疗溃疡性结肠炎的疗效。方法:将80例溃疡性结肠炎患者随机分为治疗组和对照组各40例,对照组给予柳氮磺吡啶治疗,治疗组在对照组的治疗基础
近年来,劳动争议在我国迅速成为一个引起广泛社会参与的热点问题。从政府、非政府组织到争议案件当事人,从学术研究到大众传媒、从理论界到实务界,越来越多的个人及组织从不同的
背景:类风湿性关节炎(rheumatoid arthritis,RA)是一种以慢性、对称性多关节炎为主要表现的自身免疫性疾病。本病呈全球性分布,在我国的患病率为0.32%—0.36%,低于欧美国家白种人的
<正>一、关于内部控制流程设计研究背景的思考回顾我国的内部控制发展历程,上世纪90年代中期我国《独立审计具体准则》首次明确了"内部控制"的定义,让内部控制问题第一次走进
患者男,50岁,于1981年1月8日入院。该患有慢性咳喘史15年余,每年冬春发病,近年来因绿脓杆菌感染,投多种抗生素,疗效不佳,本次因咳喘加重,咳大量黄痰、血痰伴胸闷、气短而入
期刊
对变频系统用电力电缆载流量的计算原理和主要影响因素进行讨论,给出了相应的计算公式。选择典型规格电缆进行载流量试验,得到了在不同频率下电缆载流能力的实际测试数据。与