视频中人工文本的检测与提取

来源 :天津大学 | 被引量 : 0次 | 上传用户:anlyok
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网、通信技术、智能手机行业等的飞速发展,视频的获取和传输变得极为便利。同时视频本身具有信息量丰富、观看舒适等优势,种种因素使得视频取代传统媒介成为最流行的媒体。目前上传、下载视频十分方便,线上视频的数量急剧增长。随之而来,如何从海量视频中高效地索引,检索和定位想要的视频内容成为了当下的热点问题。与低语义层级的感受信息(如纹理等)和其他高级语义信息(如视频中人物活动等)相比,视频中的人工文本能够更加直接、准确地描述视频内容。而且,通过对视频文本的分析可以帮助检测违法视频。提取视频文本的关键技术包括在复杂背景下准确地发现、确认和识别多语言、多字体的文本。在本文中,我们提出了一个新颖的结合了角响应特征图和迁移深度卷积神经网络的方法来检测和识别视频文本。首先,我们利用角响应特征图以高召回率找出候选文本区域;其次,我们利用两种投影分析方法将候选文本区域划分成候选文本行;然后,我们利用迁移学习,根据VGG16,ResNet50,InceptionV3构造真假文本行判别网络来去除假阳性样本;最终我们提出一个新颖的基于模糊C均值聚类的分离算法从复杂的背景中提取出干净的文本层送入商用光学字符识别软件进行准确识别。三个公开数据集和我们构建的高分辨率数据集上的测试结果表明本文提出的方法具有高性能和鲁棒性。
其他文献
随着电动汽车的普及以及相关政策的推广,针对车用电池的研究也逐渐成为大家所关注的热点。电池SOC估算是电池研究领域的一个重要的研究方向。准确地预估动力源的SOC对汽车来
本论文首先综述了静电纺丝技术和特殊润湿性多孔膜在油水分离领域的研究进展。表面接枝聚合物刷是一种常见的化学改性方法。可以实现纤维膜表面性能的调控,然而表面接枝聚合
萨尔曼·拉什迪是印裔英国作家,被人们称为后殖民文学教父,其作品多以母国印度和南亚次大陆为背景,通过描述人物个人的经历展现印巴分治前后印度次大陆的政治动乱、社会变革及宗教纠纷等社会现象。在《午夜之子》中,拉什迪将现实与虚构相结合,以具有超能力的主人公萨里姆·西奈作为叙述主体,向读者展示了一个充满反常规要素的不稳定世界。因此,本文以反常规叙事为理论基础,从时间和空间两个层面分析《午夜之子》中的反常规现
汽车行驶过程中,由于装配工艺、材料等问题造成车内的各个结构、零部件产生各种各样的噪音。这些噪音对于整车的舒适性影响很大,会导致消费者质疑车辆的质量和做工。因此提前
实现降本增效是企业推行精益管理的直接目的,生产任务的科学调度和设备的高效利用可以认为是实现制造企业降本增效的关键。稳定可靠的设备状态是调度计划顺利实施的前提条件,
在现代工程中,以柔性机械臂为典型的机械构件应用已经很普遍,在高新技术领域尤其是机器人技术和航空航天技术中,高速、轻质、高精准度和智能化已成为未来发展趋势,因此以柔性
软黏土在全球的分布范围十分广泛,且分布区域多是沿海城市,沿海城市经济发展迅速,与之相伴的大量基建工程开始投入建设。软黏土的力学性质评价,特别是与时间有关的力学特性和
元启发式算法在求解现实生活中遇到的复杂组合优化问题时,显示出了它的优越性,常见的算法有禁忌搜索、模拟退火、遗传算法、迭代局部搜索等。这些算法基于局部搜索采用不同的策略使算法逃出局部最优,其中局部搜索使用的邻域算子定义了算法搜索空间中各个解之间的邻接关系,不适当的邻域算子会使得搜索变得无效,因此邻域算子的调优直接影响到元启发式算法的性能。为了更好地将算子调优策略与问题的结构特征相结合,弥补现有算子调
船用电缆在船舶的整体构造中扮演着电能输送和信息传递的角色,保证其绝缘性能的良好对整个船舶的正常运营和人员安全有着重要意义。为及时发现失效的船用电缆并对其进行维修
随着三维渲染和可视化技术的快速发展,三维模型被广泛地应用在计算机辅助设计、娱乐游戏及机械设计等领域。互联网上普遍存在数以亿计三维模型,如何精确、高效和快速地从大规