论文部分内容阅读
摘要:目的:研究图像纹理分析方法对原发性肝癌CT图像识别能力。方法:选择我院在2010年3月-2013年3月间收治得30例确诊为原发性肝癌患者的CT图像和30例确诊正常肝CT图像为研究样本,采用一阶统计特征、灰度共生矩阵、灰度行程矩阵等提取方式提取正常肝癌和原发性肝癌CT图像纹理特征,通过t检验进行特征选择和分类识别。结果:一阶矩、和均质在正常肝和原发性肝癌中的差异有统计学意义(P<0.05),但是熵在正常肝和原发性肝癌之间的差异无统计学意义,分别选取样本做检测和训练样本的神经网络分析方法原发性肝癌检出率达到了93.45±5.33%。结论:神经网络设计优化后对原发性肝癌有着很高得到识别准确率,在原发性肝癌计算机辅助诊断中有着一定的应用价值。
关键词:原发性肝癌;特征选择;图像纹理
【中图分类号】R735.7 【文献标识码】A 【文章编号】1672-8602(2015)03-0018-01
原发性肝癌是肝细胞或者肝内胆管上皮细胞的恶性肿瘤,在致死性恶性肿瘤中位于第5位。CT是各种影像学检查中能够比较准确反映肝脏病理形态的一种检测方法[1]。弥散性和非弥散性肝脏疾病主要的诊断学区分特征是正常组织是否被破坏,在CT图像上主要体现为图像纹理的变化,而根据不同CT图像纹理特征差异,能够通过计算机进行原发性肝癌和正常肝组织的识别与分析,对于我国肝癌患者数量众多,诊断工作繁重的现状来说,实现计算机诊断是有着重要意义的。本次研究以我院在2008年3月-2013年3月间收治的40例确诊为原发性肝癌患者的CT图像和40例确诊正常肝CT图像为研究对象,对原发性肝癌CT图像纹理进行了研究。
1 资料与方法
1.1 一般资料
选择我院在2008年3月-2013年3月间收治得30例确诊为原发性肝癌患者的CT图像和30例确诊正常肝CT图像为研究样本,全部样本在年龄、受教育程度等方面差异无统计学意义(P>0.05)。
1.2 方法
将选择的80个样本图像采集并存储在计算机上,选择图像兴趣区。由经验丰富的医师指导,选取80个20*20的兴趣区,40个为正常肝,40个属于原发性肝癌。
1.2.1 纹理特征提取
选用一阶统计特征、灰度共生矩阵、灰度行程矩阵三种提取策略提取纹理特征[2]。
1.2.2 特征选择
不是每个特征都能够用于样本图样区分,对于某个特定特征,两个样本差异显著才可记为有效特征,否则为冗余特征。
采用t检验时,首先选择两类类性特征样本值,此时两类特征值方差不等并且未知,建立基本假设:
H0:△:μ=μ1-μ2≠0
H1:△μ=μ1-μ2≠0
进行t检验,H0成立时可获得统计量。
1.2.3 神经网络识别
采用BP神经网络进行正常肝和原发性肝癌分类,输入层、隐含层和输出层组成分类器,输入层中包含和有效特征数目相等的输入神经元,隐含层有十个,输出层有一个。设置收敛判断值为0.0001,训练步数最大200,如果训练数据和网络输出误差平方低于这两个限度,可认为网络收敛[3]。
1.3统计学处理
在本次研究中采用统计学软件SPSS20.0 对统计的数据进行处理,计量资料采用t检验,计数的资料采用χ2检验,以(P<0.05)为差异具有统计学意义。
2 结果
2.1 统计特征
采用上述图像问题采样算法,每个兴趣区都采集28个特征问题,通过t检验选择有效特征,显著性差异水平取0.05,一阶统计特征有15个特征差异显著,其余为冗余特征。特征数目量较大,不便直接列取,为了校验t检验特征值是否准确,在有效特征中选择一阶矩、和困之和冗余特征熵,观察不同特征在不同性质图像上统计分布差异,如表2-1:
一阶矩、和均质在正常肝和原发性肝癌中的差异有统计学意义(P<0.05),但是熵在正常肝和原发性肝癌之间的差异无统计学意义,无法将其从两个样本中分开,结果和t检验特征选择相符,证明这种选择机制比较准确。
2.2 神经网络识别
在神经网络分类器中输入经过t检验选择的特征向量,使用MATLAB神经网络工具箱进行分析计算和函数仿真模拟。不同特征量物理意义不同,有着各自的动态范围,这种特征有着明显的不可比性,分类前需要对特征值进行归一化处理,特征值取上限,μ取下限做归一化处理,调整到[0,1]之间:
方案A的识别率达到了100%,但是方案A的全部样本即是训练集又是测试集,样本识别结果失去了客观性,方案B对原发性肝癌的识别率达到了93.45±5.33%,说明应用方案B的神经网络分析方法对肝脏CT图像有着很高识别率,这是符合模式辨识理论规律的,对于未学习过的样本需要根据已学习样本训练结果进行推理,识别率虽然有所下降,但是结果有着较好客观性。
3 讨论
原发性肝癌是世界范围内致死率第五的恶性肿瘤,我国的发病率也很高,严重威胁了患者的生命健康,我国肝癌患者众多,给诊断和普查工作带来了很大困难,长期以来,使用计算机进行肝癌CT图像纹理分析还缺乏高效准确的算法,成为实现原发性肝癌CT图像的计算机辅助诊断的主要技术难题[4]。本次研究选择了一阶统计、灰度共生矩阵和灰度差分矩阵图像纹理取样算法,提高了样本采集的代表性:
①一阶统计特征
是图像灰度的一阶概率分布,是一种比较基本的纹理特征描述。
P(I)=灰度级为1的像素数/区域内总像素数 (1-1)
②灰度共生矩阵
通过估计图像二阶组合条件概率密度函数提取特征。描述四个方向上距离为d的一对象元具有灰度i和j的概率,每个元素都有距离、角度、灰度值和概率4个特征值,通过灰度共生矩阵能够计取对比度、相关系数、和方差等共13个特征量,从每个兴趣区中都能够提取13个特征值。
③灰度行程矩阵
是连续、共线,灰度级相同的像素点,通过某个既定图像能够计算获得灰度游程矩阵,表示四个方向上灰度g,长度d灰度串出现的总次数,能够提取短行程优势、长形成优势、灰度不均匀度度量以及行程总数百分率等参数量。
同时应用了神经网络进行原发性肝癌识别,经过两种方案分析准确率的比较,证明1/3样本作为测试样本,2/3作为训练样本的分析方式对原发性肝癌的检出率为93.45±5.33%,说明基于神经网络的原发性肝癌CT图像计算机辅助诊断有着理想的识别能力,有着很高的临床推广价值。
参考文献
[1] 郭堑,农村立,等.图像纹理分析技术在肝纤维化CT图像分析中的应用研究进展[J].实用肝脏病杂质,2009,12(3):229-230.
[2] 刘建华,王建伟.基于图像处理的CT图像肝癌诊断技术研究[J].清华大学学报,2014,51(7):917-923.
[3] 李桂树.分维方法在肝癌超声图像纹理识别中的性能比较研究[J].中南大学学报,2011,42(9):2747-2748.
[4] 陶政.原发性弥漫结节型肝癌与多发结节型转移性肝癌的CT表现[J].医技与临床,2014,12(25):68-70.
关键词:原发性肝癌;特征选择;图像纹理
【中图分类号】R735.7 【文献标识码】A 【文章编号】1672-8602(2015)03-0018-01
原发性肝癌是肝细胞或者肝内胆管上皮细胞的恶性肿瘤,在致死性恶性肿瘤中位于第5位。CT是各种影像学检查中能够比较准确反映肝脏病理形态的一种检测方法[1]。弥散性和非弥散性肝脏疾病主要的诊断学区分特征是正常组织是否被破坏,在CT图像上主要体现为图像纹理的变化,而根据不同CT图像纹理特征差异,能够通过计算机进行原发性肝癌和正常肝组织的识别与分析,对于我国肝癌患者数量众多,诊断工作繁重的现状来说,实现计算机诊断是有着重要意义的。本次研究以我院在2008年3月-2013年3月间收治的40例确诊为原发性肝癌患者的CT图像和40例确诊正常肝CT图像为研究对象,对原发性肝癌CT图像纹理进行了研究。
1 资料与方法
1.1 一般资料
选择我院在2008年3月-2013年3月间收治得30例确诊为原发性肝癌患者的CT图像和30例确诊正常肝CT图像为研究样本,全部样本在年龄、受教育程度等方面差异无统计学意义(P>0.05)。
1.2 方法
将选择的80个样本图像采集并存储在计算机上,选择图像兴趣区。由经验丰富的医师指导,选取80个20*20的兴趣区,40个为正常肝,40个属于原发性肝癌。
1.2.1 纹理特征提取
选用一阶统计特征、灰度共生矩阵、灰度行程矩阵三种提取策略提取纹理特征[2]。
1.2.2 特征选择
不是每个特征都能够用于样本图样区分,对于某个特定特征,两个样本差异显著才可记为有效特征,否则为冗余特征。
采用t检验时,首先选择两类类性特征样本值,此时两类特征值方差不等并且未知,建立基本假设:
H0:△:μ=μ1-μ2≠0
H1:△μ=μ1-μ2≠0
进行t检验,H0成立时可获得统计量。
1.2.3 神经网络识别
采用BP神经网络进行正常肝和原发性肝癌分类,输入层、隐含层和输出层组成分类器,输入层中包含和有效特征数目相等的输入神经元,隐含层有十个,输出层有一个。设置收敛判断值为0.0001,训练步数最大200,如果训练数据和网络输出误差平方低于这两个限度,可认为网络收敛[3]。
1.3统计学处理
在本次研究中采用统计学软件SPSS20.0 对统计的数据进行处理,计量资料采用t检验,计数的资料采用χ2检验,以(P<0.05)为差异具有统计学意义。
2 结果
2.1 统计特征
采用上述图像问题采样算法,每个兴趣区都采集28个特征问题,通过t检验选择有效特征,显著性差异水平取0.05,一阶统计特征有15个特征差异显著,其余为冗余特征。特征数目量较大,不便直接列取,为了校验t检验特征值是否准确,在有效特征中选择一阶矩、和困之和冗余特征熵,观察不同特征在不同性质图像上统计分布差异,如表2-1:
一阶矩、和均质在正常肝和原发性肝癌中的差异有统计学意义(P<0.05),但是熵在正常肝和原发性肝癌之间的差异无统计学意义,无法将其从两个样本中分开,结果和t检验特征选择相符,证明这种选择机制比较准确。
2.2 神经网络识别
在神经网络分类器中输入经过t检验选择的特征向量,使用MATLAB神经网络工具箱进行分析计算和函数仿真模拟。不同特征量物理意义不同,有着各自的动态范围,这种特征有着明显的不可比性,分类前需要对特征值进行归一化处理,特征值取上限,μ取下限做归一化处理,调整到[0,1]之间:
方案A的识别率达到了100%,但是方案A的全部样本即是训练集又是测试集,样本识别结果失去了客观性,方案B对原发性肝癌的识别率达到了93.45±5.33%,说明应用方案B的神经网络分析方法对肝脏CT图像有着很高识别率,这是符合模式辨识理论规律的,对于未学习过的样本需要根据已学习样本训练结果进行推理,识别率虽然有所下降,但是结果有着较好客观性。
3 讨论
原发性肝癌是世界范围内致死率第五的恶性肿瘤,我国的发病率也很高,严重威胁了患者的生命健康,我国肝癌患者众多,给诊断和普查工作带来了很大困难,长期以来,使用计算机进行肝癌CT图像纹理分析还缺乏高效准确的算法,成为实现原发性肝癌CT图像的计算机辅助诊断的主要技术难题[4]。本次研究选择了一阶统计、灰度共生矩阵和灰度差分矩阵图像纹理取样算法,提高了样本采集的代表性:
①一阶统计特征
是图像灰度的一阶概率分布,是一种比较基本的纹理特征描述。
P(I)=灰度级为1的像素数/区域内总像素数 (1-1)
②灰度共生矩阵
通过估计图像二阶组合条件概率密度函数提取特征。描述四个方向上距离为d的一对象元具有灰度i和j的概率,每个元素都有距离、角度、灰度值和概率4个特征值,通过灰度共生矩阵能够计取对比度、相关系数、和方差等共13个特征量,从每个兴趣区中都能够提取13个特征值。
③灰度行程矩阵
是连续、共线,灰度级相同的像素点,通过某个既定图像能够计算获得灰度游程矩阵,表示四个方向上灰度g,长度d灰度串出现的总次数,能够提取短行程优势、长形成优势、灰度不均匀度度量以及行程总数百分率等参数量。
同时应用了神经网络进行原发性肝癌识别,经过两种方案分析准确率的比较,证明1/3样本作为测试样本,2/3作为训练样本的分析方式对原发性肝癌的检出率为93.45±5.33%,说明基于神经网络的原发性肝癌CT图像计算机辅助诊断有着理想的识别能力,有着很高的临床推广价值。
参考文献
[1] 郭堑,农村立,等.图像纹理分析技术在肝纤维化CT图像分析中的应用研究进展[J].实用肝脏病杂质,2009,12(3):229-230.
[2] 刘建华,王建伟.基于图像处理的CT图像肝癌诊断技术研究[J].清华大学学报,2014,51(7):917-923.
[3] 李桂树.分维方法在肝癌超声图像纹理识别中的性能比较研究[J].中南大学学报,2011,42(9):2747-2748.
[4] 陶政.原发性弥漫结节型肝癌与多发结节型转移性肝癌的CT表现[J].医技与临床,2014,12(25):68-70.