【摘 要】
:
幼儿图书配套的动画、游戏、增强现实应用等电子资源以图文并茂、形声并举的多媒体优势提升了纸质书本的表现力和感染力。然而,当前纸质图书与电子资源之间普遍缺乏自动化关
论文部分内容阅读
幼儿图书配套的动画、游戏、增强现实应用等电子资源以图文并茂、形声并举的多媒体优势提升了纸质书本的表现力和感染力。然而,当前纸质图书与电子资源之间普遍缺乏自动化关联的机制,导致用户难于便捷、精确、快速地访问与图书内容对应的电子资源。本文将关联纸质图书与电子资源看作一个基于内容的图像检索问题,研究基于深度哈希网络的大规模幼儿图书页面检索方法,设计并实现百万级规模的图书页面检索系统,为用户提供一种“扫描即访问”的方式来精确定位与图书内容对应的电子资源。针对便捷、精确、即时响应三个目标,提出了“预处理”—“特征提取”—“哈希加速”的三步式图书页面检索框架,并从以下几个方面开展了研究:(1)图书页面图像预处理。为降低用户拍摄的图书页面图像中的背景和几何畸变对检索的不利影响,提出了一种由粗到精的无交互图像分割和几何畸变校正算法。首先利用图书页面与背景的颜色分布差异性,采用朴素贝叶斯方法对图书页面和背景像素进行分类,经聚类后确定图书页面的粗略位置;然后,利用图书的粗略位置初始化DenseCut图像分割算法,分割得到精确的图书页面区域;最后通过透视变换将图书页面区域校正为矩形,纠正几何畸变。实验结果表明,所提出的图书页面图像预处理方法可以有效降低背景和几何畸变对检索精度的不利影响,并且具有良好的实时性。(2)基于卷积神经网络的图书页面图像特征提取。由于图书页面中包含了异常丰富的视觉信息,图书页面检索精度高度依赖于海量的标注数据集。为此,提出了基于卷积神经网络的图书页面图像特征提取方法。首先,使用任务无关数据集(ImageNet)预训练卷积神经网络:然后,使用小规模的图书页面数据集精调网络,使得卷积神经网络的知识域从图像分类迁移到图书页面检索;最后提取卷积神经网络的中间层作为图书页面检索特征。实验结果表明,采用所提出方法提取的图像特征在百万级图书页面数据集上取得了优秀的检索精度,并且具有较大的特征压缩潜力。(3)基于深度哈希网络的图书页面检索加速。使用欧式距离度量两个卷积神经网络输出的高维浮点特征的相似度计算量较大,在大规模数据集上进行图书页面检索无法满足即时响应要求。因此,提出了一种基于深度哈希网络的检索加速方法。首先,利用切片层将高维特征向量均分为若干特征片段;接着,由映射层分别将各个特征片段转化为[0,1]单个浮点特征值;然后,利用阈值化层将映射层输出的浮点值转化为1比特哈希值(0或1),完成高维度浮点特征值到低维度哈希码的转换;最后,使用海明距离度量两个哈希码的相似度。实验结果表明,采用所提方法将特征向量转换为64比特哈希码后,遍历百万级数据集的距离度量运算耗时仅为0.33s。在以上研究的基础上,实现了一个大规模图书页面检索及电子资源关联系统。实验表明,该系统在一个规模为155万的图书页面数据集上取得的Top-1命中率为82.55%、Top-5命中率为88.67%,在单服务器(一片英伟达1080Ti GPU)上的检索速度为0.61秒/张。用户使用该系统以无约束方式对图书拍照即可精确定位并访问与图书内容对应的电子资源。
其他文献
都市圈的发展一直以来都是党中央与国务院的重大战略部署,都市圈发展质量高低是相关省市能否高速、高质量发展的关键。本文以合肥都市圈为研究对象,首先,从定性与定量两个角度,分别分析了合肥都市圈经济空间结构的演变;其次,运用中心指数模型、经济联系强度模型和经济联系强度隶属度模型,研究了合肥都市圈内城市的中心度、城市间的经济联系强弱及方向和都市圈空间圈层结构;最后,运用面板模型和空间面板模型,结合合肥都市圈
随着人们对私立高等教育的需求不断增长,私立高校在许多国家得到广泛发展,马拉维也不例外;但私立大学运行成效如何有待关注。本文旨在研究马拉维私立大学的办学成效和挑战,包
当今中小学语文教育要求大量增加传统文化与古代文学知识的比重和考核力度。并要求教师活学活用,以生动形象的方式向学生教授相关知识。这就对高校汉语言文学专业毕业生的知
无线传感器网络(Wireless Sensor Network,WSN)的一个重要研究领域是对网络覆盖优化问题的研究。网络覆盖优化是指通过移动传感器节点的位置实现对WSN的监测对象或监测区域的
近年来,破坏生态环境重特大刑事案件频发,运用刑事司法手段对破坏生态环境犯罪行为进行有效打击,贯彻落实国家“实行最严格的生态环境保护制度”的顶层设计已经迫在眉睫。作为兼具重要刑事司法职能的行政机关,全国多个省(直辖市、自治区)的各级公安机关乃至公安部均相继设立组建了打击破坏生态环境犯罪的专职警种队伍,并取得了一定的治理成效。然而通过近年来的公安工作实践发现,公安机关在履行有关职能方面存在一系列问题,
随着各个领域对控制对象跟踪精度和容错性的要求日益提高,单传感器检测系统已经逐渐难以满足。多传感器技术凭借自身的优势,在军事、民用领域发挥着越来越重要的作用。基于状
在网络研究领域,路由和拥塞问题通常是分开讨论,在全局层面则更是如此。尽管有文章提出了快速重路由中的服务质量保证机制,但仅仅面向受故障影响的流量,并不考虑全局的影响,
多项研究表明,阅读障碍儿童由于存在视空间认知能力上的缺陷,导致无法使用有效的视觉加工策略,从而表现为阅读上的困难。视空间认知能力可以从可视化、方向和心理旋转(MR)三个方面考察,其中,心理旋转与阅读障碍的关系以及阅读障碍儿童在不同材料上的心理旋转特点是以往研究关注不多且存在争议的问题。因此,本研究采用标准瑞文智力测验、识字量测验和注意缺陷多动障碍SNAP-IV教师评估量表,从新疆乌鲁木齐四所小学三
目的:近期研究表明,神经胶质瘤中存在众多长链非编码RNA(Long non-coding RNAs,Lnc RNAs)的下调,然而,Lnc RNA在这一复杂疾病中担任的角色与具体的机制却仍旧不甚明了。本研究旨在探究Lnc RNA“LINC01198”在胶质瘤的增殖与替莫唑胺耐药性中所承担的功能与具体机制。方法:通过qRT-PCR检测胶质瘤组织标本与对照的正常组织标本中LINC01198的表达量。应
自1978年的党的十一届三中全会确立改革开放伟大方针以来,我国已经跨过了改革开放四十多载时光,取得了不胜枚举的成就。在改革开放四十多载的伟大实践中,中国特色社会主义是轴心、马克思主义中国化是线索、总结实践经验是基本,促使对中国特色社会主义的认识在一以贯之的接力探索中不断丰富、不断深化,创新性地发展了马克思主义中国化,先后产生了邓小平理论、“三个代表”重要思想、科学发展观和习近平新时代中国特色社会主