基于深度残差神经网络与迁移学习的微体化石小样本图像识别研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:dingyongguo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中国陕西省南部地区具有丰富的寒武纪早中期(535百万年前)宽川铺组微体化石,盛产四方塔型壳、早期动物胚胎、原牙形刺等各类微体化石,有助于探寻寒武纪时期动物的起源以及大爆发的成因,是十分重要的研究方向。但是早期的研究人员因技术手段的限制主要依靠人工显微镜筛选的方法寻找微体化石。微体化石数量庞杂,但因为具有研究价值样本稀少,人工手段存在误差,并发现效率低下,极大影响了寒武纪早期生命进展。基于上述研究背景,本文通过建立陕南宽川铺组微体化石图像数据集,针对微体化石小样本分类识别问题,提出了机器学习和深度残差网络的解决方案,其研究如下:(1)针对微体化石目前可用高质量公开数据集缺乏这一现象,将采集来的陕南宽川铺微体化石样本,通过酸泡,拍摄,分类等过程,建立包含宽川球、西乡塔、牙形刺等9类共计4507张微体化石图像数据集。(2)基于机器学习方向梯度直方图、Gabor变换方法识别小样本微体化石。针对化石数据量不足的问题,采用显微图像数据扩充、CT图像多角度投影两种数据扩充方法。显微图像扩充后的微体化石平均识别率达到93%。在极少样本情况下,CT图像多角度投影的微体化石图像相比较微体化石显微图像数据,识别率提升了40%以上。(3)基于迁移学习与Res Net残差网络相结合的微体化石小样本图像识别方法,该方法以34层深度残差网络为训练模型,采用基于模型的迁移方法,冻结低层参数,重新训练中上层网络参数,构建出了微体化石图像识别模型,使用Tr Ada Boosting算法作为微体化石模型参数优化方法。共设计了15组不同的实验。实验表明,本文提出的深度残差网络化石识别模型准确率达到了96.7%,优于支持向量机、随机森林。并且针对小样本(1-shot)图像识别率70.5%,优于传统机器学习方法、VGG、Goog Le Net。本文提出的方法针对陕南宽川铺微体化石识别率均高于95%,在单样本情况下也达到了70.5%,达到了本文研究目标,具有一定的研究意义。
其他文献
糖肽质谱数据的无标记定量算法是生物信息学中重要的研究内容之一。随着计算机技术的快速发展,使得面向糖肽质谱数据的无标记定量算法研究成为可能。为了完成计算机辅助的糖肽质谱数据无标记定量,本文解决的问题及主要工作如下:(1)针对峰簇混叠导致的峰簇分离提取易出错问题,本文结合离子同位素分布规则,提出了一种基于三维信息的多电荷混叠峰簇分离提取算法(3D-based Multiple-charges Over
软件缺陷是软件或者程序中存在的某种破坏程序正常运行能力的问题、错误,其存在会给软件带来安全隐患。随着软件规模变大,其结构越来越复杂,如何在软件动态变更过程中尽早发现和修复软件缺陷,已成为各大软件公司关注的热点。软件缺陷预测(Software Defect Prediction,SDP)旨在通过某种手段检测当前项目中哪些模块可能出现缺陷。传统的软件缺陷代码检测采取全量检测方式,时效性较低,并且在缺陷
知识追踪任务是根据学生历史学习行为来追踪学生的知识状态,以预测学生在未来交互中会如何表现。通过对学生知识状态建模,可以为学生提供个性化的学习指导,帮助学生摆脱题海战术,同时也有助于教师更好地了解学生的学习水平,并相应地调整教学方案。本文以学生答题序列数据为研究对象,主要针对深度知识追踪开展如下相关研究工作:(1)针对现有的深度知识追踪方法没有全面考虑学生答题行为特征对学生学习过程的影响这一问题,提
近年来,互联网汽车共享服务的迅速发展满足了人们对于舒适、便捷的交通方式的需求,但大量的网约车加剧了城市的道路拥堵、环境污染和资源消耗。网约车拼车服务使一辆车能够同时服务多位出行路线相似的乘客,减少非必要车辆出行,缓解交通压力。但是,现有的动态拼车匹配算法忽视了潜在的乘客出行需求,导致车辆的拼车载客率较低。因此,研究潜在乘客的出行规律并提出基于出行需求预测的动态拼车匹配算法具有较大的意义。此外,在乘
气敏传感器是传感器领域中的重要组成部分,对推动智能感知监测、实现万物互联具有极其重要的作用。虽然半导体气敏传感器已广泛应用于各个领域,但目前依然存在诸多问题以待解决,如工作温度较高、气体选择性较差,低响应度等,故而开发工作在室温环境高选择性和高响应度的气敏传感器尤为重要。本论文从气敏传感材料研制的角度出发,采用两步微波水热法合成了可在室温环境对NO2气体具有高度选择性的Bi2S3/MoS2复合材料
图像分类是大数据及智能信息时代下应运而生的产物,已经成功的应用到商品分类、美食分类、旅游景点分类、视频分类、图书分类等各种场景。目前,大部分图像中都包含多个感兴趣对象,且需要多个标签对这些对象进行标记,这类图像分类任务即多示例多标签学习(MIML)。大部分MIML深度学习架构更多关注如何在空间维度里改进网络,然而在实际应用此类方法并不能有效提高图像分类精度,其原因在于这些架构没有考虑到一个标签有多
随着智能终端的普及,休闲类游戏因其玩法简单易上手的特点,同时由于越来越多优秀的人工智能算法的应用极大丰富了游戏趣味性与益智性,逐渐成为一种老少皆宜的娱乐方式。而对游戏开发者而言,虽然市面上出现的流行游戏引擎已经在很大程度上降低了游戏开发难度,但是在面临不同的游戏需求时,开发人员仍然需要根据具体游戏玩法进行引擎层之上的结构设计与开发。针对以上问题本文对常见休闲类游戏游戏进行结构分析,提出基于可扩展状
目前,全球正面临着人口老龄化,并由此引发了一系列严峻的社会问题。随着家庭结构模式趋于小型化,生活节奏不断加快,养老问题变得格外突出,对社会的发展带来严峻考验。智能机器人的出现为上述问题的解决提供了一种新的思路,本文基于机器视觉算法和机器人行为控制算法的研究,设计并实现了一个视觉引导下的机器人行为控制系统。本文主要工作包含:(1)基于深度相机的物体识别与定位。首先拍摄了953张包含44种物体的室内场
粒计算是Zadeh教授提出的一种模拟人类思考问题方式进而解决大规模复杂问题的有效方法.粒计算的一个重要内容是信息粒化,信息粒化可以简单理解为在给定粒化准则下得到一个粒层的过程,它是粒计算的必要过程.在利用粒计算思想求解复杂问题的过程中,会依据一定的粒化准则将复杂问题划分为多个子问题,进而对子问题进行描述和处理.所以,通过恰当的粒化准则来获取合理的粒描述,可以令决策者对粒的理解更加透彻,进而有助于复
在大数据时代,诸多机器学习算法对数据降维等数据处理方法有了更高的要求,主成分分析作为一种重要的数据降维算法,在经典机器学习中占有举足轻重的地位,其量子化算法在2014年由Lloyd首次提出,使其在量子计算机上的实现具备了理论基础。量子主成分分析作为量子机器学习中的重要算法,近年来得到诸多科研学者的青睐,目前发展的q PCA算法可以直接提取较大的特征成分,减少采样量,但也存在一些不足:一是估计不准确