【摘 要】
:
光学字符识别(optical character recognition, OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。文字信息提取模块包括图像预处理、文字信息区域的截取和修正
【机 构】
:
南京邮电大学 通信与信息工程学院,江苏 南京 210003;南京邮电大学 地理与生物信息学院,江苏 南京 210003
论文部分内容阅读
光学字符识别(optical character recognition, OCR),简单来说,主要是利用光学技术和计算机技术将目前所使用的印刷体字符通过检测每个像素的亮、暗模式转换成一个黑白图像的文件,然后再使用识别的手段将这个黑白图像的文件转换成计算机可以识别的文字。该文主要分为四个模块:文字信息提取、字符识别、系统实现、实验结果与分析。文字信息提取模块包括图像预处理、文字信息区域的截取和修正、字符分割,对输入的图片进行处理,以降低随机噪声,确保文字信息区域包含完整的文字信息,提高识别的准确性。
其他文献
蚁群算法作为一种启发式算法,最初是用来解决TSP(traveling salesman problem)问题,基本思想来源于自然界蚂蚁觅食的最短路径原理,目前在快递配送中已被广泛使用.但其前期信息素匮乏导致搜索速度较慢和计算最优路径时迭代次数过多的问题尚未较好地解决.针对这一问题,提出了一种改进蚁群算法.首先,通过借鉴遗传算法启发函数的思想,对蚁群算法信息素初始值引入改进启发函数进行动态更新,针对不同情况进行寻优节点选择,解决前期搜索速度较慢的问题.其次,对信息素更新公式进行改进,引入自适应计算公式,根据
试验研究了 Φ52mm45MnVTi钢终轧917~922℃水冷返红680~830℃的组织和力学性能.结果表明,随着返红温度的降低,钢材的屈服强度及抗拉强度不同程度的升高,韧性先升高再降低,组织类型为铁素体和珠光体.当返红温度750~770℃时,钢材组织为均匀细小的铁素体和珠光体组织,且试验钢的珠光体片间距平均2.39 μm;钢材的抗拉强度平均841 MPa,屈服强度平均547.5 MPa,平均冲击功50.5 J,强韧性匹配最佳,满足使用要求.
抑郁症已经成为世界第四大疾病,并且具有高发病率,由于精神问题的诊断十分困难,抑郁症的治疗率很低.随着互联网的发展,社交媒体被越来越多的人使用,人们倾向于在社交媒体上表达自己的观点,这就为研究者创造了大量可以使用的数据,但是抑郁症预测不等同于文本分类,存在难以找到判定抑郁的统一标准,以及难以构建神经网络模型两个问题.对此,提出了一种融合局部和整体特征的胶囊网络模型,该模型将情绪词典和胶囊网络进行融合,可以有效地发现微博用户中潜在的抑郁症患者.模型分为局部特征选择和整体特征提取两部分,对于局部特征通过情绪词典
汽车发动机连杆用钢C70S6BY的工艺流程为130 t转炉-LF-RH-CCM-加热-轧制.LF精炼通过低碱度1.5~2.0的CaO-SiO2-Al2O3-MgO渣系,RH采用氮气驱动,退泵后循环5~1O min,可以精准控制钢中S、N含量(0.064%~0.068%S和136×10-6~142×10-6N).轧制后入坑缓冷,钢材组织由珠光体和少量铁素体组成,钢中非金属夹杂物主要是硫化锰和复合夹杂物.1 050℃30 min空冷钢的抗拉强度达到995~1 018 MPa,屈服强度586~611 MPa,伸
科研人才的发现和挖掘不仅可为学者画像、研究领域热度分析、科研成果预测等诸多环节提供基础信息支撑,也是提升精准服务科研人才和推动前沿科技智能化水平的关键技术.针对传统机器学习算法对科研人才领域命名实体识别准确效率低、高度依赖语料库以及分词不准确等问题,文中面向科研人才的基础属性和科研属性,对该领域命名实体进行了类别和标注符号的定义,形成了7大类共计19小类的命名实体.通过使用BERT模型生成词向量,结合BiLSTM对上下文关系的记忆能力和CRF对标注规则的学习能力,构建了面向科研人才领域的命名实体识别BER
实验研究了沉淀硬化模具钢0Cr3Ni3MoCuAl在860~1 010℃35 min固溶处理和450~560℃3 h时效处理的组织和硬度.结果表明,固溶处理温度为950℃,保温时间35 main,空冷至室温,其HRC硬度值可达39.5;组织为粒状贝氏体和低碳板条马氏体的混合组织,并有少量残余奥氏体.时效处理温度为500℃,保温时间为3 h,空冷至室温,其HRC硬度值可达到44.1;组织为回火贝氏体.
为了克服非线性和强噪声特征对交通流短时预测准确度的影响,应用交通流预测模型获得更为准确的交通流信息是智能交通建设的关键环节.文中构建了小波降噪的深度极限学习机对城市道路的交通流量进行预测,并与原极限学习机和小波BP神经网络模型的预测效果进行比较.将实验城市一年中电子警察采集到的各路口五分钟车流量作为训练集,构建了极限学习机、基于小波降噪的深度极限学习机和小波BP神经网络模型,分别对各路口高峰时段车流量进行预测,采用三类误差分析指标刻画三种模型的预测效果.实验结果表明,小波降噪的深度极限学习机预测误差评价值
研究了低碳铝镇静钢SPHC(/%:0.04C,0.03Si,0.14Mn,0.027Al)572~648℃卷取温度以及冷轧压下量65%~75%对该钢700℃退火性能的影响.结果表明,在相同的冷轧压下量下,随着卷取温度的增加,强度基本呈现下降趋势,伸长率相对有所上升,n、r值基本呈下降趋势;在相同的卷取温度下,随着冷轧压下量的不断增加,强度呈现下降趋势,伸长率先升后降,n、r值基本呈先升后降的趋势.热轧卷取温度620℃,冷轧变形量70%时,700℃退火3 mm SPHC钢板性能达到最佳,即抗拉强度286 M
自然语言和音乐是人们表达情感和描绘事物的两种语义符号系统.分析和建立语言与音乐的语义关联不仅有助于提供更精确的文本和音乐的检索和推荐服务,还可以帮助研究者进一步理解情感语义.已有的研究主要关注自然语言和音乐的表层符号特征,较少考虑其语义含义,从而限制了基于自然语言和音乐语义关联的应用的精确性和可解释性.另一方面,部分应用,例如音乐情感的多标签分类,需要更精确的自然语言和音乐的语义关联.所以,分析和建立自然语言和音乐的语义关联对于面向文本和音乐的应用有较大的促进作用.文中提出了自然语言和音乐的情感语义关联度
通过在210 tRH精炼IF钢3个浇次的试验,采用扫描电镜详细研究了 RH精炼过程中调Ti时机对IF钢洁净度的影响.结果表明,加Al后2、4、6 min调Ti,RH结束时钢液中的N含量平均分别为26.7×10-6、23.6×10-6、27.4×10-6.当吹氧升温所耗氧气量在30~40 m3,RH到站氧平均为579×10-6时,RH结束T[O]为70.3×10-6,当吹氧升温氧耗量在75~90 m3,RH到站氧平均为669×10-6时,RH结束T[O]为109.2×10-6.随着加Al前氧活度增加,RH结