论文部分内容阅读
由于糖尿病在世界范围内患病人数众多,对人造成的危害极大,近年来死亡率急剧上升。同时可怕的是会引发多种严重的并发症,比如高血压、肠胃疾病、糖尿病眼病、血管病变等等。当下还没有有效的治疗方案可以治疗糖尿病。因此,尽早发现是否患有糖尿病是降低糖尿病死亡率的关键。而近年来,随着深度学习在图片识别、自然语言理解、自动问答、机器翻译、情感分析以及股价预测等领域大放异彩,研究人员开始将深度学习应用于医疗诊断领域。糖尿病作为常见的非传染性疾病之一,深度学习应用于糖尿病预测上的研究更值得关注。目前学者们在研究糖尿病的预测课题时,一般会采用传统的机器学习方法。本文鉴于目前糖尿病预测的研究现状和深度学习的发展趋势,尝试利用开源深度学习平台—TensorFlow来搭建糖尿病预测模型,对糖尿病预测进行研究,主要工作有以下四个方面:1)深入研究了数据预处理的相关理论,对来自UCI的皮马印第安人糖尿病数据集进行数据的预处理,重点讨论了运用平均值替换缺失值的方法和利用信息增益算法(IG)进行特征选择来完成对糖尿病数据集的预处理工作。2)研究了基于K邻近算法(KNN)和渐进梯度回归树算法(GBDT)在糖尿病预测研究中的效果,并进行性能评估和结果分析。3)研究深度神经网络(DNN)在开源的人工深度学习系统的具体实现。基于开源深度学习平台TensorFlow,根据前向传播算法和BP算法搭建深度神经网络(DNN)作为分类器,对比了深度神经网络和传统的机器学习方法的分类效果。4)基于上述研究成果,搭建糖尿病预测诊断平台,从医院的实际需求出发,将包含数据预处理和深度神经网络作为分类器实现预测平台,为医生诊断糖尿病提供参考意见。实验结果表明,基于深度神经网络(DNN)算法构建的预测模型相比于传统的机器学习预测模型有一定的优势。随着数据集的增大,深度神经网络模型的优势会更加显现,可以不断提高预测的准确度。同时,利用TensorFlow搭建深度神经网络模型的方案已经比较成熟。