论文部分内容阅读
摘 要:牙齿健康问题是目前最主要的口腔问题之一,牙齿疾病具有发病率高覆盖面广的特点,影响国民生活质量。传统的检测方法包括视诊、探诊、X线片等。对牙齿甚至身体伤害大。将现今热门的机器视觉技术应用于口腔疾病诊断,创新设计基于机器视觉模式识别的口腔诊断算法。为了精确的诊断口腔疾病,设计了一种基于卷积神经网络的口腔牙齿疾病诊断系统。该系统利用传感器摄像头采集口腔图像,并使用GoogLeNet网络模型对图像进行特征提取与识别。
关键词:牙齿健康;识别系统
一、深度学习的优势
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。用更多的数据或是更好的算法来提高学习算法的结果。对某些应用而言,深度学习在大数据集上的表现比其他机器学习(ML)方法都要好这些又如何转化为现实生活中的情形呢?深度学习更适合无标记数据,因而它并不局限于以实体识别为主的自然语言处理(NLP)领域。
二、卷积神经网络
卷积神经网络(convolutional neural network,CNN)是一种多层监督学习神经网络,具有极强的适应性,善于挖掘数据局部特征和组合高级语义信息进行分类。该网络包括卷积层、激励层、池化和全连接层。卷积层和池化层是实现卷积神经网络特征提取功能的核心模块;采用梯度下降法最小化损失函数,对网络中的权重参数逐层反向调节,通过多次的迭代训练提高网络的精度。
(一)卷积层。卷积层是一种特殊的神经元网络层,是用卷积核通过卷积运算扫描图像,从而获得相应特征,其具有局部感受和权值共享的特性。卷积层的输出公式为:yi=∑ikij*xi+bi,此式中:yi为卷积层输出;kij为卷积核;*为卷积运算;xi为输入图像;bi为偏置项。在卷积神经网络中,层与层之间的神经元节点不再是全连接形式,而是利用层间局部空间相关性将相邻每一层的神经元节点只与它相近的上层神经元节点连接,即局部感受,从而降低了神经网络架构的参数规模。卷积层具有共享权重机制,每个卷积核参数重复作用于整个感受野中,对输入图像进行卷积,卷积结果构成了输入图像的特征图。此机制不仅能提取图像特征,而且降低了卷积神经网络模型参数量。
(二)激励层。激励层是卷积层输出后的非线性单元。由于多层神经网络模型具有高度非线性,而卷积层是一个线性的计算过程,为保证非线性需引入一个激励层(即非线性单元)。激励层计算公式为:f=σ(yi),此式中:yi为卷积层输出;激励函数σ为输入和输出的映射关系。为了让模型更快速的学习,在激励层中引入修正单元。常用的修正函数包括Logistic函数、tanh函数、Sigmoid函数、ReLU函数等。
(三)池化层。池化层也称做下采样,其要功能是对特征图进行特征压缩。通过选择原来某个区域的最大值或平均值代替那个区域,达到对特征图压缩的目的。池化层采用Maxpool方法,其计算公式为:yj=f(1/n∑jxj+b),此式中:yj为池化层输出;n表示从卷积层到池化层的窗口大小;xj为n×n大小的区域;bj为偏置项。由于池化层大幅减小了输入特征图的空间维度,从而使得权重参数的数目减少了75%,降低了计算成本,并且可以控制系统过拟合。
(四)全连接层
在全连接层中,神经元节点是线性一维排列结构,层与层各神经元节点之间相互连接。全连接层输出公式为:
此式中:xj为上层神经元传来的输入信号;wij为从神经元j到神经元i的连接权重;θi为阈值;f为激活函数。由于最后一层的池化层,输出为图像各个区域的高级特征,所以需要全连接层将这些非线性特征,以简易的方式进行组合,利用Softmax或支持向量机(SVM)分類器对输入图像进行分类。
三、GoogLeNet解析
由于采用增加神经网络的深度的方法,来提升网络识别分类的性能,易造成网络复杂度增加和梯度消失等问题,为了解决上述问题,提出了GoogLeNet网络,通过增加网络的宽度的方法,来提升网络性能。该网络是一个22层的深度网络GoogLeNet网络的宽网络是一个22层的深度网络,像素感应大小是224×224,采用了RGB彩色三通道。GoogLeNet网络模型的核心单元是Inception模块,模块结构框图如图2所示。Inception模块的由4个并行支路组成,支路1采用1×1卷积进行特征提取;支路2采用1×1和3×3卷积的串行连接;支路3采用1×1和5×5卷积的串行连接,1×1卷积降低输入的特征通道和减少参数量,3×3和5×5卷积用于增大对图像的感受野;支路4采用3×3最大池化和1×1卷积,最大池化改变输入的特征排列,1×1卷积进行特征提取,最后将4个并行线路得到的特征图在通道维度上拼接起来。
四、智能口腔疾病检测系统
智能口腔检测系统是以图像显示为核心,使用图像显示模块完成图像数据的实时显示以及瞬时抓取,并通过WiFi模块实现无线传输,实现对口腔牙齿图像进行处理及分类等功能。该系统主要由控制器模块,图像采集模块、图像显示模块、图像存储与传输模块、图像检测平台和电源模块组成。
五、结语
牙齿健康不仅仅是解除了牙齿疾病的困扰,更重要的是它体现了一个人的修为、涵养,而且是自信与活力的源泉。通过日常检测牙齿检查获取个人牙齿的健康状况等信息,并生成图像后,同时可根据已获得的牙齿图像等信息远程连接牙科医生,实现对牙齿疾病的早期诊断早期预防。为了便于用户可以更好的了解牙齿健康常识。另外,未来将在大量搜集的图像数据基础上设计算法,自动分析牙齿健康状况并给与反馈。
关键词:牙齿健康;识别系统
一、深度学习的优势
深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。深度学习是无监督学习的一种。深度学习的概念源于人工神经网络的研究。含多隐层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。深度学习的概念由Hinton等人于2006年提出。基于深信度网(DBN)提出非监督贪心逐层训练算法,为解决深层结构相关的优化难题带来希望,随后提出多层自动编码器深层结构。此外Lecun等人提出的卷积神经网络是第一个真正多层结构学习算法,它利用空间相对关系减少参数数目以提高训练性能。用更多的数据或是更好的算法来提高学习算法的结果。对某些应用而言,深度学习在大数据集上的表现比其他机器学习(ML)方法都要好这些又如何转化为现实生活中的情形呢?深度学习更适合无标记数据,因而它并不局限于以实体识别为主的自然语言处理(NLP)领域。
二、卷积神经网络
卷积神经网络(convolutional neural network,CNN)是一种多层监督学习神经网络,具有极强的适应性,善于挖掘数据局部特征和组合高级语义信息进行分类。该网络包括卷积层、激励层、池化和全连接层。卷积层和池化层是实现卷积神经网络特征提取功能的核心模块;采用梯度下降法最小化损失函数,对网络中的权重参数逐层反向调节,通过多次的迭代训练提高网络的精度。
(一)卷积层。卷积层是一种特殊的神经元网络层,是用卷积核通过卷积运算扫描图像,从而获得相应特征,其具有局部感受和权值共享的特性。卷积层的输出公式为:yi=∑ikij*xi+bi,此式中:yi为卷积层输出;kij为卷积核;*为卷积运算;xi为输入图像;bi为偏置项。在卷积神经网络中,层与层之间的神经元节点不再是全连接形式,而是利用层间局部空间相关性将相邻每一层的神经元节点只与它相近的上层神经元节点连接,即局部感受,从而降低了神经网络架构的参数规模。卷积层具有共享权重机制,每个卷积核参数重复作用于整个感受野中,对输入图像进行卷积,卷积结果构成了输入图像的特征图。此机制不仅能提取图像特征,而且降低了卷积神经网络模型参数量。
(二)激励层。激励层是卷积层输出后的非线性单元。由于多层神经网络模型具有高度非线性,而卷积层是一个线性的计算过程,为保证非线性需引入一个激励层(即非线性单元)。激励层计算公式为:f=σ(yi),此式中:yi为卷积层输出;激励函数σ为输入和输出的映射关系。为了让模型更快速的学习,在激励层中引入修正单元。常用的修正函数包括Logistic函数、tanh函数、Sigmoid函数、ReLU函数等。
(三)池化层。池化层也称做下采样,其要功能是对特征图进行特征压缩。通过选择原来某个区域的最大值或平均值代替那个区域,达到对特征图压缩的目的。池化层采用Maxpool方法,其计算公式为:yj=f(1/n∑jxj+b),此式中:yj为池化层输出;n表示从卷积层到池化层的窗口大小;xj为n×n大小的区域;bj为偏置项。由于池化层大幅减小了输入特征图的空间维度,从而使得权重参数的数目减少了75%,降低了计算成本,并且可以控制系统过拟合。
(四)全连接层
在全连接层中,神经元节点是线性一维排列结构,层与层各神经元节点之间相互连接。全连接层输出公式为:
此式中:xj为上层神经元传来的输入信号;wij为从神经元j到神经元i的连接权重;θi为阈值;f为激活函数。由于最后一层的池化层,输出为图像各个区域的高级特征,所以需要全连接层将这些非线性特征,以简易的方式进行组合,利用Softmax或支持向量机(SVM)分類器对输入图像进行分类。
三、GoogLeNet解析
由于采用增加神经网络的深度的方法,来提升网络识别分类的性能,易造成网络复杂度增加和梯度消失等问题,为了解决上述问题,提出了GoogLeNet网络,通过增加网络的宽度的方法,来提升网络性能。该网络是一个22层的深度网络GoogLeNet网络的宽网络是一个22层的深度网络,像素感应大小是224×224,采用了RGB彩色三通道。GoogLeNet网络模型的核心单元是Inception模块,模块结构框图如图2所示。Inception模块的由4个并行支路组成,支路1采用1×1卷积进行特征提取;支路2采用1×1和3×3卷积的串行连接;支路3采用1×1和5×5卷积的串行连接,1×1卷积降低输入的特征通道和减少参数量,3×3和5×5卷积用于增大对图像的感受野;支路4采用3×3最大池化和1×1卷积,最大池化改变输入的特征排列,1×1卷积进行特征提取,最后将4个并行线路得到的特征图在通道维度上拼接起来。
四、智能口腔疾病检测系统
智能口腔检测系统是以图像显示为核心,使用图像显示模块完成图像数据的实时显示以及瞬时抓取,并通过WiFi模块实现无线传输,实现对口腔牙齿图像进行处理及分类等功能。该系统主要由控制器模块,图像采集模块、图像显示模块、图像存储与传输模块、图像检测平台和电源模块组成。
五、结语
牙齿健康不仅仅是解除了牙齿疾病的困扰,更重要的是它体现了一个人的修为、涵养,而且是自信与活力的源泉。通过日常检测牙齿检查获取个人牙齿的健康状况等信息,并生成图像后,同时可根据已获得的牙齿图像等信息远程连接牙科医生,实现对牙齿疾病的早期诊断早期预防。为了便于用户可以更好的了解牙齿健康常识。另外,未来将在大量搜集的图像数据基础上设计算法,自动分析牙齿健康状况并给与反馈。