论文部分内容阅读
摘 要:在分析人工智能机器学习的基础上,利用实例,从各方面论述了基于人工智能机器学习的文字识别方法需要注意的问题,希望对于今后我国的机器学习领域发展具有一定帮助。
关键词:人工智能;机器学习;文字识别;神经网络
前言
在不断发展的科学技术背景下,智能化则是各个行业所发展的趋势,机器学习就是智能化中一个重要方面。当前,人类在语音、图像识别、智能机器人以及智能搜索领域中获得很大的进步,也有着很多的成功应用实例。当前,自动驾驶技术、深度问答都是建立在人工智能中的机器学习领域的基础上,在逐步发展壮大的过程中,已经能够体现出具有巨大的优越性[1,2]。鉴于此,应该重视基于人工智能机器学习的文字识别方法的研究工作,希望能够在此领域获得进一步的发展。
一、人工智能机器学习概述
在具体的计算机程序智能化研究中,应该从大脑模拟角度思考,这则是进行机器学习的基本内容。在分析人脑进行知识构建的情况下,应该对于环境中涉及到数据和规律进行总结分析,并能积极应用在云计算程序中,并能有效改善程序相应的执行能力。在人工智能机器学习方面,从二十世纪中期,就已经获得必要的成就,但是,对于其具体的学习机理还存在很大的研究空间,应该从机器学习的发展历史,进行思考。一是,在20世纪中期,这个阶段中计算机信息技术呈现出飞速发展的趋势,人们逐渐应用神经网络模型,一些机器学习算法(比如,进化算法)以及判别函数在背景下出现,但由于上述算法存在一定的局限性,难以应用于实践中;二是,在二十世纪七十年代中,这部分专家对于人工智能机器学习陷入一定的瓶颈期,在理论方面存在很大的问题,无法弥补实践中的理论差距,还对于神经网络学习器存在一定的理论缺陷,研究工作进展很慢;三是,到了二十世纪八十年代,机器学习领域获得比较大的成功,更多专家学者关注到不同类型的学习器模型的实际应用,并能发展出多种的学习算法,能够较好地建立起理论和实践之间的联系,能够将人工智能机器学习应用在很多研究领域中,并在理论方面有了一定的突破和应用,比如,在股票交易、天气预报、图像处理等应用中。所以,人工智能機器学习在某种程度上也是体现国家综合竞争力的表现,应该在各个方面予以充分重视,保证充分提升我国在人工智能机器学习领域中的实力。
二、人工智能机器学习基础上的文字识别方法
1.文字识别系统分类器
在进行文字系统分类器选择中,经常应用BP神经网络分类器,具体的构建中,应该结合BP神经网络的需求,进行网络构建,利用net1,net2和net3来对于特征数据训练的表征,结合BP网络要求,包括相应的输入层、输出层以及两个隐层。
在进行网络初始化的过程中,主要包括initwb和initnw两种方式,前者的应用中,主要就是使得全部网络偏置量进行初始化,并进行权值赋值,这还需要结合实际来应用自定义矩阵,而后者则利用网络中的默认初始化进行,在具体的应用中,利用算法Nguyen以及Widrow,能够保证在不同的层次中,能够有效初始化偏置值以及权重问题,在这样的背景下,输入控件的全部神经元活动能保障被输入,尽量避免在神经元的浪费问题,表现出比较高效的训练速率,体现出较好的优势。
2.文字识别性能
经过统计,在日常生活中所经常出现的汉字达到六千多字,其中,医学领域中包括2000多字。基于此,这里选择常用的医学汉字为基础,对于六百字符的数字进行图像构建操作,其中,字幅图像一共包括十幅,并分成六组,前九幅字符图像则是进行训练的数据,另外,最后一组则为进行测试的图像。具体将其应用在上述的LSSVM以及BP神经网络中,经过实验分析,可以得到如下结论。
具体的交叉验证中,文字识别系统能够有效判断部分文字,经过统计,应用此系统,为了满足识别率高达2000字符以上。为了进一步完善此系统的应用效果,应该对于分类器在每一组的特征基础进行分类操作,要想保证能够有效识别更多文字,则应该在该分类器中包含以上全部字符。所以,应该对于2000汉字进行划分处理,利用不同的小组特征进行训练,保证不同分类器所具备的同一类的特征。在此基础上,针对不同分类器当中的数据进行筛选,应用票数最多的识别结果,将其应用于交叉验证当中,在有效的验证后对最终的识别结果进行输出。
三、结论
由此可见,在信息技术飞速发展的背景下,人类文明也在经历着翻天覆地的变化,信息技术正在改变我们的生活和工作。人工智能机器学习则是信息技术发展的一个重要方面,具有非常重要的研究价值以及广阔的发展空间,在此基础上,应该充分重视人工智能机器学习的研究工作,并详细开展文字识别方法展的研究,对于进一步提升我国的机器学习发展具有重要意义。
参考文献
[1]欧文武,朱军民,刘昌平.视频文本定位[J].计算机工程与应用,2004,40(30).
[2]张鹏,谢晓尧.基于改进的C-支持向量机的手写体数字高识别率方法研究[J].贵州师范大学学报(自然科学版),2014,32(2).
(作者单位:武汉软件工程职业学院)
关键词:人工智能;机器学习;文字识别;神经网络
前言
在不断发展的科学技术背景下,智能化则是各个行业所发展的趋势,机器学习就是智能化中一个重要方面。当前,人类在语音、图像识别、智能机器人以及智能搜索领域中获得很大的进步,也有着很多的成功应用实例。当前,自动驾驶技术、深度问答都是建立在人工智能中的机器学习领域的基础上,在逐步发展壮大的过程中,已经能够体现出具有巨大的优越性[1,2]。鉴于此,应该重视基于人工智能机器学习的文字识别方法的研究工作,希望能够在此领域获得进一步的发展。
一、人工智能机器学习概述
在具体的计算机程序智能化研究中,应该从大脑模拟角度思考,这则是进行机器学习的基本内容。在分析人脑进行知识构建的情况下,应该对于环境中涉及到数据和规律进行总结分析,并能积极应用在云计算程序中,并能有效改善程序相应的执行能力。在人工智能机器学习方面,从二十世纪中期,就已经获得必要的成就,但是,对于其具体的学习机理还存在很大的研究空间,应该从机器学习的发展历史,进行思考。一是,在20世纪中期,这个阶段中计算机信息技术呈现出飞速发展的趋势,人们逐渐应用神经网络模型,一些机器学习算法(比如,进化算法)以及判别函数在背景下出现,但由于上述算法存在一定的局限性,难以应用于实践中;二是,在二十世纪七十年代中,这部分专家对于人工智能机器学习陷入一定的瓶颈期,在理论方面存在很大的问题,无法弥补实践中的理论差距,还对于神经网络学习器存在一定的理论缺陷,研究工作进展很慢;三是,到了二十世纪八十年代,机器学习领域获得比较大的成功,更多专家学者关注到不同类型的学习器模型的实际应用,并能发展出多种的学习算法,能够较好地建立起理论和实践之间的联系,能够将人工智能机器学习应用在很多研究领域中,并在理论方面有了一定的突破和应用,比如,在股票交易、天气预报、图像处理等应用中。所以,人工智能機器学习在某种程度上也是体现国家综合竞争力的表现,应该在各个方面予以充分重视,保证充分提升我国在人工智能机器学习领域中的实力。
二、人工智能机器学习基础上的文字识别方法
1.文字识别系统分类器
在进行文字系统分类器选择中,经常应用BP神经网络分类器,具体的构建中,应该结合BP神经网络的需求,进行网络构建,利用net1,net2和net3来对于特征数据训练的表征,结合BP网络要求,包括相应的输入层、输出层以及两个隐层。
在进行网络初始化的过程中,主要包括initwb和initnw两种方式,前者的应用中,主要就是使得全部网络偏置量进行初始化,并进行权值赋值,这还需要结合实际来应用自定义矩阵,而后者则利用网络中的默认初始化进行,在具体的应用中,利用算法Nguyen以及Widrow,能够保证在不同的层次中,能够有效初始化偏置值以及权重问题,在这样的背景下,输入控件的全部神经元活动能保障被输入,尽量避免在神经元的浪费问题,表现出比较高效的训练速率,体现出较好的优势。
2.文字识别性能
经过统计,在日常生活中所经常出现的汉字达到六千多字,其中,医学领域中包括2000多字。基于此,这里选择常用的医学汉字为基础,对于六百字符的数字进行图像构建操作,其中,字幅图像一共包括十幅,并分成六组,前九幅字符图像则是进行训练的数据,另外,最后一组则为进行测试的图像。具体将其应用在上述的LSSVM以及BP神经网络中,经过实验分析,可以得到如下结论。
具体的交叉验证中,文字识别系统能够有效判断部分文字,经过统计,应用此系统,为了满足识别率高达2000字符以上。为了进一步完善此系统的应用效果,应该对于分类器在每一组的特征基础进行分类操作,要想保证能够有效识别更多文字,则应该在该分类器中包含以上全部字符。所以,应该对于2000汉字进行划分处理,利用不同的小组特征进行训练,保证不同分类器所具备的同一类的特征。在此基础上,针对不同分类器当中的数据进行筛选,应用票数最多的识别结果,将其应用于交叉验证当中,在有效的验证后对最终的识别结果进行输出。
三、结论
由此可见,在信息技术飞速发展的背景下,人类文明也在经历着翻天覆地的变化,信息技术正在改变我们的生活和工作。人工智能机器学习则是信息技术发展的一个重要方面,具有非常重要的研究价值以及广阔的发展空间,在此基础上,应该充分重视人工智能机器学习的研究工作,并详细开展文字识别方法展的研究,对于进一步提升我国的机器学习发展具有重要意义。
参考文献
[1]欧文武,朱军民,刘昌平.视频文本定位[J].计算机工程与应用,2004,40(30).
[2]张鹏,谢晓尧.基于改进的C-支持向量机的手写体数字高识别率方法研究[J].贵州师范大学学报(自然科学版),2014,32(2).
(作者单位:武汉软件工程职业学院)