基于信任随机森林的不确定手写数字识别研究

来源 :成都理工大学 | 被引量 : 1次 | 上传用户:guolsh003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,海量数据如潮水般涌入社会生产中,这些来自不同渠道的数据夹杂的不确定信息逐渐增多。例如在手写数字识别的图像采集和存储过程中,常因多种因素导致图像局部缺失或污损进而引入不确定性,实践中的处理方法多是通过人工标注完成不确定推理,而后基于确定数据集进行学习建模,这种处理方式效率低、成本高、稳定性差。如何高效处理不确定信息并基于不确定数据集完成分类器的学习与构建,成了手写数字识别研究面临的新挑战。信任函数理论为不确定数据处理提供了崭新的思想与方法,近年来受到广泛关注。本文沿着先驱指引的方向继续前行,针对不确定手写数字数据集学习与建模困难问题,提出了基于机器学习决策树理论改进而来的信任随机森林算法,通过引入信任函数理论和集成学习思想,给出了有效建模不确定数据集并完成手写数字识别的新尝试:为解决训练样本输出类标缺失不确定,改进算法引入了证据理论信任函数思想方法,通过构建样本间距离到基本信任分配函数的映射,计算不确定样本基本信任分配函数值,运用证据组合规则完成对样本输出类别标记的预测推理;对于训练样本属性值缺失不确定,通过调整样本的权重,优化相关计算,完成最优划分属性选择和缺失样本的类别划分,并在决策树结点划分过程中引入随机属性子集选取规则来降低决策树“过拟合”风险,实现了信任随机决策树的构建;为了提高学习器的泛化性能,运用集成学习思想将若干棵基信任随机决策树结合起来生成信任随机森林,最终完成对不确定手写数字数据集的学习与建模。为了评估信任随机森林算法建模不确定数据集并实现手写数字识别的实际泛化性能,本文进行了实验验证研究:首先,对数据集中图像进行二值化和细化处理,生成手写数字实验数据集;然后,对训练集数据样本从统计和几何两个层面进行多特征提取,完成手写数字训练集输入特征向量的构建;最后,利用Python编程语言完成信任随机森林算法的计算机编程实现,并在不确定手写数字数据集上运行算法进行验证实验,通过对模型参数的调整优化和实验结果的研究分析,论证了信任随机森林算法建模不确定数据集并实现手写数字识别的可行性和高效性。
其他文献
DOA(Direction of Arrival)估计广泛应用于通信、雷达、声呐探索以及卫星导航等领域中。当信号发出信号后,接收阵列需要在有噪声的环境中估计信号来波方向,因此准确估计信号
极化码是第一种在理论上被证明可以达到香农信道容量的信道编码方案,其凭借较低的复杂度及优越的性能很快成为了纠错码领域的研究热点。自极化码被选为5G标准中控制信道的短
应用市场中的应用正逐年呈指数形势增长,面对海量的应用市场,用户急需一个良好的推荐机制来高效、迅速的获取到自己感兴趣的应用。通过调研分析目前热度较高的几大应用市场发现,现有的平台大多采用基于用户群体行为相似度的协同过滤推荐算法,忽略掉了用户的个性特征,未必符合用户的真实需求且很容易发生局部应用热度持续增长,而冷门应用永远不会被用户所发现的情况。基于以上现状,本文围绕用户的个性化推荐展开了一系列研究。
航线和雷达的脉冲重复频率组参数直接关系到杂波背景下的预警机对目标的检测性能。一方面,不同航线下雷达所处的地理环境不同,同一块地面杂波所处的距离门和多普勒门及其后向散射功率会随着当前载机的径向距离、方位、相对运动状态、主波束指向等变化而变化,影响雷达对某些方向和距离的动目标检测性能。另一方面,机载预警雷达往往采用中、高重复频率的重频组工作模式,其发射的多重频的具体数值决定了杂波和目标在距离-多普勒域
为满足现代无线通信系统对系统容量和传输速率日益增长的需求,LTE-A系统引入了载波聚合、多天线增强等技术,进一步提高了系统性能,为用户带来了更好的业务体验。随着网络建设工作的开展,各项新技术的部署也给现有的网络测试设备带来了新的挑战,因此研发一款专业化的新型测试仪表具有重要的意义。信号检测作为LTE-A系统接收端的重要环节,其性能优劣会直接影响整个通信系统的质量。本文基于LTE-A空口监测分析仪的
英国一向被视为两党制的典型代表国家,但是2010年和2017年两次议会大选都产生了悬浮议会,并最终导致二战后首次联合政府和第二次少数党政府的出现,这说明英国典型的两党竞争体制发生了某些变化。本文由此出发,开始了对二战后英国两党竞争格局演变的研究。本文首先对英国1945年至2019年21次议会大选数据进行了分析,发现了二战后英国政党竞争格局演变的基本特点:1945年至1973年间,英国的政党体制为典
清初书坛受文字狱的影响,许多书家将目光转移到了碑学,加上大量金石器物的出土,致使碑学逐渐兴起。李鱓作为扬州八怪的早期人物之一,又是其中唯一一位在宫廷供职过的书画家,他凭借敏锐的艺术嗅觉,在自己原本帖学的基础上,融合了碑派笔法,使其书法中出现了一股独特的“金石”之气。论文从李鱓所处的时代背景入手,对其在扬州画坛中的应有地位予以历史还原,剖析其书法较之郑板桥、金农等人取法石涛的异同点;从能书擅画的天资
随着卫星导航定位系统的飞速发展,全球卫星导航定位系统(GPS)以其具有的定位精度高、覆盖范围广、响应速度快、能全天候工作等优点在军民领域的应用越来越广泛。而我国自主研发的北斗卫星导航定位系统发展迅速,在囊括GPS功能的基础上,还具有短报文和双向交换信息功能。由于卫星导航定位系统应用层面趋至多样化和复杂化,天线作为卫星导航系统的终端,势必朝着兼容性更强、剖面更低、尺寸小型化、重量轻巧化的方向发展。圆
在通信技术的发展历程中,计算机仿真一直发挥着非常重要的作用,仿真已经成为通信技术研究、设计与开发必不可少的工具。随着通信系统越来越复杂,传统的仿真方法也越来越难以满足要求,迫切需要研究新一代高效率仿真技术。另一方面,机器学习近年来迅速发展,在包括计算机视觉、自然语言处理、数据挖掘等在内的许多领域显示出了强大的效果。在通信领域,机器学习也展现了它的强大之处。在此背景下,本论文研究基于机器学习的链路级
坟墓是一个族群和时代的历史体现,而墓碑作为墓葬文化的实体,墓碑的形式、铭文、装饰都反映出人们对待丧葬的价值观念,也反射了不同时代和社会的政治、经济、宗教信仰和风俗