论文部分内容阅读
本文对特征选择进行了详细研究,主要集中在特征子集的搜索算法和特征的评价标准上。对于大脑胶质瘤数据集,采用了SVM-BFS算法,该算法采用支持向量机为分类器,浮动搜索为子集搜索算法,Wrapper模型为特征选择评价标准。通过实验,表明该算法有效的解决了中小型数据集的特征选择问题。对于三种氨基酸的多元校正课题,采用了神经网络为分类器,双层遗传算法为特征子集搜索算法,Wrapper模型为特征选择评价标准进行特征选择,实验证明这种特征选择算法有效的解决了数据特征数目较大的特征选择问题。
本文另一个研究重点是复杂数据的关联分析。利用支持向量机在大脑胶质瘤数据集提取出关联规则,得到了分类标准。在另一个实验中,利用模糊规则提取算法找到了实验目标量的三种主要干扰因素;并利用基于拟合参数规则提取算法找到了所需要的每种干扰模型的典型样例。实践证明这是一种从宏观到微观有效的进行数据关联分析的算法组合。