论文部分内容阅读
本文的工作有以下几个方面:(一)从第二军医大学东方肝胆外科医院采集原发性肝癌病例344个,对取得的数据进行了机械筛选和处理,得到可以使用的192个病例,每个包含了41个属性;(二)根据课题的特点在数据挖掘技术中选择了三种有实现可能的算法进行研究与讨论,其中总结了近年来的研究热点---神经网络集成算法的原理和应用,并对其的本课题应用可能性作了讨论;归纳了决策树算法的原理和发展,且将其应用到实际的数据研究中,建树得到原发性肝癌预后的分类决策树,分析了其不合理性;粗略介绍了贝叶斯网络;最终使用朴素贝叶斯算法作为课题的落脚点,并且针对本课题的实际情况,提出了对缺损值位置的同概率分布假设以及基于分类相关性的属性筛选算法;(三)采用朴素贝叶斯算法对实际取得的临床病例进行研究,辅助预测这一疾病的预后情况,根据数据属性与预测目标的相关程度大小筛选属性,剔除弱相关属性;并以同概率分布假设对数据样本中的缺损数据进行预处理,实验结果从39个病理属性中筛选得到12个对原发性肝癌预后预测有效的属性,提高了分类准确率;(四)对这一课题作了展望。