医学影像中的文本检测与识别

来源 :第十二届中国智能机器人大会 | 被引量 : 0次 | 上传用户：THE_BOSS

【摘要】

：

【作者】

：

郜鹏宇夏思宇杨彬张俊康

【机构】

：

东南大学复杂工程系统测量与控制教育部重点实验室,南京 210096

【出处】

：

第十二届中国智能机器人大会

【发表日期】

：

2017年10期

【关键词】

：

医学影像图像识别字符分割卷积神经网络迁移学习

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为获取医学影像中的文本信息,提出了一种新的文本检测与识别办法.首先使用同态滤波与Laplacian-Sobel Product(LSP)进行文本增强,并通过形态学方法实现文本行定位;然后提出了一种基于边缘纵向投射曲线的无监督分割算法进行字符分割;最后设计了符合医学影像中文本特征的卷积神经网络(CNN)进行字符识别,并基于部分人工标定的图像,随机生成整个训练样本集.为克服繁衍训练样本与真实样本之间的偏差,采用了类别平衡加权的迁移学习方法对模型进行校正,并利用识别得到的置信度进行文本行验证.在包含1000张影像的数据集上进行测试.实验结果表明,相比当前常用方法,本文方法取得了更好的检测识别效果.

其他文献

基于无线穿戴式传感系统的智能步态检测研究

实现精确的人体步态检测并实时反馈给机器人系统,可为行走辅助机器人的控制提供可靠的人机交互信息,同时给医生评估病人下肢康复情况提供依据.本文设计了一种基于惯性传感器的无线传感器节点,在此基础上研发了一套无线穿戴式传感系统.提出了一种可靠的步长和步向检测算法,并利用回声状态网络对整个系统测量误差进行校正,进一步提高了测量精度.实验结果表明,所提系统与方法能够实现高精度的步态检测.

会议

行走辅助机器人步态检测无线穿戴式传感系统误差校正

动态场景因素干扰下基于卷积神经网络的视觉环路闭合探测研究

环路闭合探测技术是消除同步定位与地图构建(SLAM)算法中消除累积误差从而保证计算结果准确的关键一环.对于工作在户外的SLAM系统,在使用经典的视觉词袋(BoVW)算法进行环路闭合探测时容易受到多种动态场景因素(光照、天气、行人、车辆)的较大干扰.针对这一问题,本文采集了大量含有动态场景因素的图像数据用来模拟机器人在环路闭合探测时需要的关键帧信息,并依此制作了环路闭合探测实验的数据集合用来测试各图

会议

自主移动机器人环路闭合探测卷积神经网络视觉词袋算法

计算机白质模型研究

复杂网络应用广泛,但在调节随时间不断变化的并且需要整体优化的网络时仍然有所不足,本文借鉴大脑神经系统中的白质系统,建立了计算机白质模型,利用人工SC个体采集环境数据,通过判断SC个体发育为成熟个体或非成熟个体来提呈数据源信息,交由SC种群后对整个网络的状态进行分析,进而达到整体优化控制的结果,该模型通过设定不同的更新频率以适应各种变化的网络形式,试从一个新的角度解决动态网络边权关系的控制问题.

会议

计算机白质模型边权关系人工施旺细胞数据源信息参数设置控制机制

一种变电站巡检机器人智能路径规划方法研究

介绍了一种栅格地图与参数可调势场法避障相结合的变电站巡检机器人智能路径规划方法.通过在全局范围内找寻目标点进行全局路径规划,同时在局部小范围内使用参数可调的势场法避障来进行局部路径规划,该方法能有效地提高路径规划的效率与避障的准确性,实验验证了该方法的快速性与有效性.

会议

巡检机器人路径规划栅格地图参数可调势场法

液体状态机在手写识别中的应用

本文利用基于时间窗的皮质层生成算法来构建储液体状态机储备池多簇的拓扑结构,在此基础上再利用非对称STDP学习机制训练各簇神经元之间的连接强度,形成兴奋神经元主导的结构.为了测试优化后的储备池的计算能力,本文使用MNIST数据库进行手写数字识别试验,通过将数字图片转换为多输入通道的泊松脉冲作为输入,同时为了降低计算复杂度,对数据进行了归一化处理去除无效的输入.利用信号重构的思想,分别训练储备池到每个

会议

手写识别液体状态机数字图片转换泊松脉冲信号重构

基于频域显著性与空间域滤波的红外小目标检测

针对不同背景和低信噪比的红外图像,提出一种基于频域显著性与空间域滤波的红外小目标检测算法.该算法首先对原始图像进行频域高斯低通滤波,以抑制噪声、平滑图像,减少噪声和杂波对后续频域处理的影响;然后利用图像背景和目标具有不同频谱振幅的特点,采用频谱残差法得到潜在小目标的显著图;接着在空间域利用Robinson guard滤波对显著图进行背景抑制和小目标增强;最后通过自适应阈值分割来实现红外小目标的检测

会议

红外图像小目标检测频域高斯低通滤波频谱残差法自适应阈值分割

基于3D骨架隐马尔科夫模型的室内人体行为识别

针对目前人体行为识别效率低下的问题,提出了一种基于3D骨架的隐马尔科夫模型的室内人体行为识别方法.3D骨架数据量少且保留了行为关键信息的优点,并具有融合多特征和上下文信息的优势.在室内小范围情况下,利用Kinect设备获取人体运动的视频,同时提取骨骼的关节点,形成3D骨骼特征集,用这些特征来训练隐马尔科夫模型.首先建立一个姿态数据集,用于保存3D骨架信息,并设置对应的数字编号,依次遍历每种动作的特

会议

行为识别特征提取隐马尔科夫模型3D骨架

基于随机隐退DBN的脑电信号识别方法

针对DBN处理小样本脑电信号训练时间长且存在过拟合的问题,提出基于随机隐退的DBN算法对左右手运动想象脑电信号进行分类识别.先对原始脑电数据进行降维预处理,然后输入到随机隐退DBN模型中进行训练,得到最优参数值后进行分类识别.实验结果表明,与CSP、PCA、单一DBN网络等方法相比,基于随机隐退的DBN算法在保持较高识别率的同时,降低了对数据集的训练处理时间,证明了该方法的有效性.最后在智能轮椅平

会议

脑电信号识别降维预处理深度信念网络随机隐退

基于多源生物信号的下肢步态相识别

为进一步提高人体下肢步态相识别的准确性,本文研究了融合表面肌电信号(sEMG)、膝关节角度和足底压力信号的人体下肢步态相识别方法.首先,将sEMG信号进行小波包分解提取多尺度能量和多尺度模糊熵特征;然后,对提取的sEMG信号特征值采用主成分分析(PCA)方法进行降维处理,并与足底压力特征值和膝关节能量特征值构成一组特征向量.最后,将特征向量输入粒子群优化最小二乘支持向量机(PSO-LSSVM)模型

会议

下肢步态相识别多源生物信号小波包分解特征向量最小二乘支持向量机粒子群优化

基于D-S证据理论的多分类SVM人体动作识别方法

日常行为动作感知和跌倒检测是健康监护中重要的一个方面,为更好的监护老年人身体健康,提出一种基于D-S证据理论的多分类SVM人体动作识别方法.首先分别采集下肢表面肌电信号和躯干的加速度信号并进行预处理和特征提取;其次分别输入SVM得到后验概率输出,最后在决策级对SVM多分类输出进行D-S证据理论融合.实验结果表明该方法对人体8种动作识别率88.75％,能正确分类采用单源信号时所错分的样本,有效提高单

会议

人体动作识别信号预处理特征提取支持向量机D-S证据理论

医学影像中的文本检测与识别

与本文相关的学术论文