论文部分内容阅读
表皮生长因子受体(EpidermalGrowthFactorReceptor,EGFR)的扩增或突变与人类实体肿瘤密切相关。三种机器学习方法:随机森林(randomforcst,RF),k最近邻和C4.5决策树,被用于建立理论模型,来预测EGFR的抑制剂。结果表明,这些模型的预测结果均取得了令人满意的精度。又通过对比分析,发现RF模型具有较好的预测性能,并进一步修改和优化了RF模型的参数。此外,还采用特征选择程序筛选出了25个和EGFR的抑制最相关的分子描述符。最后对得到的最优RF模型进行了评价。