基于信任决策树的手写数字识别方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:w734289467
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,越来越多的信息涌入人类的生产生活中,与此同时夹杂在其中的不确定信息也日渐增多,如何从这些庞大而复杂的数据中获取有效信息成为了信息技术发展中的一项巨大挑战。尤其在模式识别问题中,不确定数据的增加大大提升了解决问题的难度。例如在机器学习领域中,手写数字识别作为热门话题一直受到广泛关注。在该问题中,研究者们可以获得大量的数据信息作为训练样本,而这其中的大部分数据都由于存在着不精确、不可靠等情况而具有或多或少的认知不确定性。工程实践中解决此问题的办法多是通过对训练样本进行人工标注的方式来获取精确训练集,然而无论是类标的手动添加亦或是待标注样本的选择都需要人工参与,人力成本会随着数据的增加而增多。如何有效处理不确定信息以及应用不确定信息完成分类器的学习与构建成为众多研究者亟待解决的难题。信任函数理论凭借其可以灵活处理多种不确定性的出众能力,近些年来受到了广泛的关注,在工程、医学等众多方面得到了广泛的应用。与传统的信息融合、证据推理方向不同,2008年信任函数在统计推断方向上的应用为信任函数理论的研究带来了更广阔的方向。在此基础上,一部分研究者率先进行了该理论与机器学习方法的结合,打破了该领域的空白,并取得了不错的成果。本文在前人的足迹上继续前行,将信任分类树与Bagging集成算法相结合,通过质量函数完成对认知不确定的建模,并通过集成一系列结构简单的信任分类树得到最终的集成分类器。其中,作为基分类器的信任分类树是在输出含有不确定的样本上直接训练得出的。与此同时,考虑到当下大部分不确定分类算法均未涉及实际应用,本文分别应用提出的BGBC4.5算法与其他常用不确定分类算法完成不确定手写数字识别问题,并取得了满意的识别精度。文章直接在输出含有大量认知不确定性的训练集上完成分类器训练,分析讨论算法数据质量及几种不确定程度变化下的表现结果以及与其他常用分类算法表现的对比,分析了各个算法的优劣性、验证了算法的优越性。
其他文献
尽管英国对高等教育的投资每年都在增长,但是每个学生的公共经费却在下降。为了满足扩大招生规模、确保教学科研质量、保持国际竞争力的国家目标,英国政府采取了一系列措施,
微信营销在企业营销发挥的作用备受瞩目。针对微信营销业务现状,对微信公众平台、微店、微信朋友圈及其竞争者进行了一定研究,并对与微信营销有密切关系的微信支付进行了分析
湖南农村人口大量流入城镇务工的人数,占农业人口53%,且绝大部分是农村青壮劳动力,农村常住人口的老弱化,给农村基层治理带来村庄空壳化、政府公共服务和村民自治制度的空转等系
报纸
目的:探讨雷珠单抗联合激光治疗增生型糖尿病视网膜病变(proliferative diabetic retinopathy,PDR)的临床疗效。方法:本研究观察对象为2014-10/2016-10我院眼科接诊的80例101
针对智能两线制温度变送器设计中的低功耗和抗干扰问题,提出了采用高性能单片机 ADuC824BS,高效率、低功耗 DC/DC 转换器 MAX653和集成温度转换器 MAX6675的解决方法。该温度
网上购物目前已经发展成为一种普遍的购物方式,在各类购物网站纷纷出现和网上购物程序日益完善的背景下,生鲜网站也应运而生。但是在网络营销这条道路上,生鲜食品这个特点突
<正> 周某,男,20岁。初诊日期:1980年3月21日。嗜睡乏力一年。每昼夜睡达十四、五小时,仍感精神不足,常常在工作时打盹。曾查脑电图正常,神经科诊为"神经性多睡症",转中医诊
期刊
新型大学建设是地方本科院校应用转型发展模式的创新,特色小镇建设是地方政府新型城镇化发展平台的创新。"新型大学·特色小镇"建设模式的特殊意义在于,地方本科院校因建在小
温度检测直接与节约能源、生产效率、安全生产、产品质量等重大经济技术指标相联系。传统温度仪表存在靠大量补偿导线、传输距离长、维护困难、非智能等缺点,智能一体化温度