论文部分内容阅读
小于胎龄儿疾病是新生儿中普遍存在的一种疾病。患有疾病的胎儿出生体重低于正常新生儿平均体重的两个标准差。在我国,尤其是在不发达地区,该疾病严重影响着胎儿的身体健康和心理健康。故研究者们一直在不断的探索小于胎龄儿的发病原因以尽量早的去干预疾病的发展,使得新生儿得到更有效的治疗。目前该疾病的预测都需要较为繁琐的医疗检测同时需要高昂的医疗设备,这对于发展中国家和地区来讲都是不容易实现的。在小于胎龄儿疾病预测问题上,研究者从最初单一体检指标的预测,再到综合多种检查结果的传统机器学习进行疾病预测,都无法很好的解决预测小于胎龄儿疾病耗时长,准确率不高的问题。随着科学技术的发展,深度学习已经成为疾病预测领域中最为有效的预测手段之一。深度学习可以有效的将底层特征抽象为高层特征,避免了传统机器学习需要人工构造特征的不准确,耗时等缺陷。但是研究者们还没有将深度学习应用到小于胎龄儿疾病预测当中。因此,本文提出基于深度学习的方法去预测小于胎龄儿疾病。本文首先利用降噪的自动编码器算法预测疾病。提出了一种改进的降噪自动编码器,通过此方法可以提高模型提取特征的鲁棒性和还原特征的能力,其中,改进的降噪自动编码器模型将父母的检测数据作为输入。同时,在自动编码器实验过程中发现文本数据的应用可能会对疾病预测有着较好的帮助。因此,本文接下来基于文本数据构造预测模型。对短文本进行分词,词向量化等操作后的特征作为神经网络的输入,与之前的体检数据合并,进行神经网络模型的训练。实验结果显示循环神经网可以更好的提取短文本特征,使得分类器更加高效,准确。最后本文利用模型融合技术进一步提高预测成绩。为了更好地提高疾病预测的效果,本文将得到的一些训练好的模型通过Stacking和投票的模型融合方法进行利用,对最终的预测效果都有着大幅度的提高。本次实验的结果证明了该论文所提出方法的有效性。论文的数据集来源于国家预怀孕检测项目2010年4月到2013年12月的数据。本文利用AUC(Area Under the Receiver Operating Characteristic Curve)进行结果的评测,模型融合后的AUC达到了0.8712,相较于其他研究者的预测成绩,高出0.0165。显示深度学习在小于胎龄儿的预测上是可以得到很好应用的。