基于神经网络的动漫人物识别研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:lxt63
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于深度学习算法的发展,人工智能技术进一步的爆发,在许多领域中取得了决定性的技术突破。其中计算机视觉例如分类、检测、语义分割等更是取得了突飞猛进的发展,也给一大批计算机视觉相关应用提供了强大的底层算法支持。另一方面随着国内国际动漫产业的不断发展,动漫IP受到越来越广泛的欢迎和关注,本文认为动漫视频分析将会是计算机的一个很好的落地应用。因此本文针对动漫视频这一特定场景下动漫人物智能识别问题开展了深入的研究,通过深度学习中的目标检测算法训练智能识别模型,并基于训练模型搭建起一套完整的动漫人物识别服务应用。该应用可以批量地捕捉和筛选含有用户喜爱动漫人物的图片和视频,从而协助用户快速地对原本陌生的动漫人物建立一个认识,唤起用户对动漫人物及相关作品的兴趣,使动画产品更具娱乐性和吸引力。本文完整地介绍了计算机视觉在动漫人物识别中的应用方式,其组织结构包括项目研究背景、已有算法介绍、训练数据收集、训练数据标注、算法改进、模型训练和模型测试、相关应用服务搭建等多个方面。本文还收集和标注了一个包含36种动漫人物的数据库,为后续该领域的研究工作奠定了坚实的基础。本文还通过研究已有的检测算法SSD(Single Shot Detector),发现在训练过程中为了提高模型的召回率,SSD设置了较多的默认框,这样就会存在正负样本及其不平衡的问题。针对这个问题,本文创新性地提出了一种调节正负样本权重因子的优化方法,通过调节正样本的损失权重和减低负样本的损失权重,使得正负样本的比重达到平衡,更加有利于模型的训练学习。另外,本文针对项目业务场景进行研究,根据项目中动漫人物的图像语义特性,重点关注深层特征,制定了SSD网络简化、加速方案,对SSD网络结构进行了不同程度的剪枝优化,通过大量测试,确定最佳简化方案。通过上述优化方法,项目所采用模型与原始SSD模型相比,推理效率提升了16%,动漫人物角色识别精度mAP从74%提升到81%,为实际的动漫人物识别应用提供强大的算法支撑。最后,本文还利用服务器端的GPU资源,通过caffe框架,搭建了一个能够提供在线动漫人物识别的服务,进一步完善了该应用,扩展了应用范围。
其他文献
行政复议决定是行政复议制度的核心问题之一,行政复议制度目的的实现和功能的发挥最终都是通过行政复议决定来完成的。行政复议决定的精细化是行政复议制度走向成熟的标志,要
现今科学技术正处于飞速发展的阶段,各个学科之间也在不断地交叉渗透,高清电子内窥镜已经成为疾病诊断及治疗过程中必不可少的仪器。传统内窥镜仅能显示二维平面,缺少深度信
成人型呼吸窘迫综合征(ARDS)为弥漫性肺组织损伤导致的非心源性肺水肿和急性呼吸衰竭的综合征。可由多种病因引起,病情凶险,缺乏特效治疗,病死率较高。临床上表现为呼吸频率
<正> 近年来,随着教育界对学生心理健康问题的逐步关注和重视,各级各类学校开始设立专门的心理辅导中心(有的学校称心理辅导室),主要负责组织和开展学校的心理健康教育与宣传
目的肺癌在全球范围内肿瘤的发病率和死亡率中居于首位,在我国的发病率和死亡率也是第一位。非小细胞肺癌为肺癌中占比最大的种类,也是目前研究的热点。伴随着科技和医疗技术的更新和发展,非小细胞肺癌的治愈率有所改变,但是其发病机制目前还不清楚,所以需要继续的探索和研究非小细胞肺癌的发生,发展和转移的机制,寻求更加特异的分子诊断标记和基因治疗靶标。LINC00261在食管癌,结肠癌,喉鳞状细胞癌,胃癌等多种癌
灵敏的嗅觉系统在昆虫寄主定位、寻找配偶等行为过程中起着重要的作用。目前的研究表明,气味结合蛋白(OBPs)、化学感受蛋白(CSPs)等多种蛋白在对气味分子的识别过程中起着重
资金是企业发展的重要动力,也是影响企业发展水平和综合实力的重要影响因素。考虑我国金融市场特殊的发展历程,债务融资是我国企业获得融资的主要渠道。由此可见,债务融资能
随着水工、矿山、铁路、公路等领域工程向着深部发展,岩爆及围岩动力失稳破坏的频次和强度日益增加,已成为制约深部安全生产的瓶颈问题。本文基于这一工程现状,以确保高应力
在世界学术之林中,考古学是一门比较年轻的学科。近些年来,虽然国内陆续翻译出版了一些水平较高的国外考古学教材,但与中国考古学的发展实际存在一定距离,不能满足我国考古学一线
报纸
自动化装配生产线上以机器人为核心的机器人装配单元是整个装配线的重要组成部分,整个单元的性能都在布局阶段确定。布局的合理性将直接影响单元后期生产。本课题对双机器人装配单元的布局优化问题进行研究,设计了一种多目标布局优化方法,协同优化设备组件位置和机器人作业任务分配。对装配单元内的设备采取长方体包络的方式,将布局问题简化为对一组矩形的最优化排列。以序列对的方式对组件设备进行定位,引入虚拟组件设备表示设