基于深度选择性神经网络的视线检测

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:michael_jian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人的视线包含有大量的信息。视线信息不仅能帮助机器理解人类行为、想法、意图,也能帮助机器理解人物周围环境。视线检测在人机交互、广告推销、视觉游戏等诸多领域都有着巨大的应用前景,但同时该任务也极具挑战性。近几年来,深度学习技术发展迅速,将深度学习技术应用到视线检测中已成为一种趋势。但目前将深度学习引入到视线检测中来的研究还处于起步阶段,研究成果较少。视线检测任务不同于一般的单输入机器学习任务。它不仅需要输入整个图片的信息,也要输入目标人物的信息,以告诉网络需要检测哪一个人物的视线。如何恰当地输入和处理这些信息,是问题的关键。现有视线检测数据集普遍数据量较少或标注效果较差。本文首先进行了数据收集和标注的工作,建立了一个约有55000张图片的视线检测数据集。该数据集场景复杂,人物姿态丰富,具有一定的实用性。本文从麻省理工学院提出的视线检测网络GazeNet入手对视线检测任务的特性进行了探究。实验表明,视线检测网络不必像GazeNet一样输入人脸框图。基于对现有理论的总结提炼,本文提出一个利用深度学习技术检测图片中特定人物视线的方法。该方法只需要输入图片信息和人眼坐标,通过ResNet对图片进行特征提取。随后引入一种特殊的网络层,被命名为选择性全连接层。它将目标人物人眼的位置映射到全连接层的局部,前向传播只在这个局部中进行。这种方式间接地将人眼的位置信息传递给了神经网络,从而使得网络不必处理人眼位置和人脸信息,减少了输入信息的数量,简化了网络结构。同时,针对本文的选择性全连接层,本文采用了一种新的数据增强方法——数据均衡,它使得数据的分布更加均匀。实验表明,本文设计的视线检测网络取得了比之前的研究更好的效果,在准确率和速度方面均有提升。
其他文献
<正>血管性痴呆[1]是中风后的常见症状,中风患者发生痴呆的原因主要是因为长期高血压、脑动脉硬化、反复发生腔隙性脑梗死或其他原因的多发性梗死,导致脑室扩大,皮质萎缩,使
1988年,我们对全省国家管理的205处万亩以上的大中型水库供水及河流引水灌溉工程,进行了老化损坏情况的调查.并与1981年三查三定的资料以及1985年与1986年两次抽样调查的结
目的探讨&#39;门卫&#39;导丝技术(GWT)在冠状动脉慢性完全闭塞病变(CTO)正向介入治疗中的应用价值。方法选取2015年7月—2017年3月在平顶山市第二人民医院行经皮冠状动脉介入
通过对单糖进行NaBH4还原,用1-甲基咪唑作催化剂和乙酸酐反应生成醇糖乙酯,反应室温10min即可完成,利用糖醇乙易挥发的特性,用OV-1701石英毛细管柱进行分离,得到了五个不同的单峰。
马克思主义中国化历程可以划分为"三波",第一波发生于1919年五四运动前后至1927年中国大革命失败,第二波发生于1935年遵义会议至1956年社会主义制度的建立,第三波从1978年中共
综述了精益生产、供应链和精益供应链管理的发展与现状,分析了电子商务与供应链管理之间的关系,给出了精益供应链电子商务的基本框架以及精益供应链电子商务化7个方面的内容.
氰氟虫腙是一种新型的缩氨基脲类杀虫剂。利用核磁共振氢谱(1 H NMR)、氢-氢相关谱(1 H-1 H COSY)、核磁共振碳谱(13 C NMR)、氟谱(19F NMR)、DEPT谱、异核单量子相关谱(HSQC
构建基于AdaBoost-SVM的上市公司信用风险评估模型,利用遗传算法(GA)寻优优化传统的支持向量机(SVM),通过AdaBoost迭代获得SVM弱分类器。利用该模型评价我国A股制造业上市公司的
抗战时期的“学术中国化”运动,是中国抗日战争进入相持阶段后,一批马克思主义者和进步知识分子发起的一场颇为壮观的思想文化运动。在有些研究者看来,“学术中国化”运动似
<正> 扁桃体脓肿穿刺致颈内动脉破裂,我科治疗1例,报告如下: 患者韩××,女,13岁。40天前因“感冒,高烧”,咳嗽,右侧颈部肿胀,咽喉部痛,在当地医院诊断为“右侧扁桃体周围脓