论文部分内容阅读
目的探索机器学习算法及衍生算法在医学数据集上的分类效果,以期更好的发现计算机在辅助医学诊断方面的应用价值。方法以皮马印第安人糖尿病数据集为例,利用WEKA平台构建机器学习模型,包括基于贝叶斯定理的NavieBayes、基于集成学习的Bagging、基于树思想的J48等模型,共六大类21种算法,运用多维度多指标对所建立模型的预测效果进行评价。结果RMSE和RRSE均较小的前5位算法依次为Logistic、LMT、RotationForest、RandomForest和Bagging;LMT、SMO、Logi