论文部分内容阅读
特征选择是机器学习领域的一个重要研究内容。在许多实际应用中,需要采用特征选择技术优化特征集,提高分类的精度和效率。在数字乳腺图像肿块的自动检测过程中,需要提取有效反映肿块和正常区域差异的特征集,从而将肿块检测出来。本文根据数字乳腺图像肿块检测的特点和关键技术,对特征选择在数字乳腺图像肿块检测中的应用进行了研究,主要工作和成果如下:
1.提出分类互补性的概念,并据此设计一种基于分类互补性的特征选择方法。实验表明,该方法有效改善了特征选择的性能和效率。将算法用于数字乳腺图像肿块检测的特征提取模块中,能有效地优化特征集,在保持高敏感性的前提下,较好地降低了假阳性率。
2.分析特征选择和类别不平衡学习的关系,研究了类别不平衡特征选择方法的可行性,提出类别不平衡学习上的特征选择策略,设计实现了一种基于相关性的类别不平衡特征选择算法。实验表明类别不平衡特征选择与传统特征选择方法相比,能够更好的改善类别不平衡学习的分类器性能,提高小类样本的分类精度。将算法用于数字乳腺图像肿块ROI检测模块中,能有效地提高包含肿块样本的可疑区域的检测效果。
3.分析特征选择和集成学习的关系,对特征选择与集成学习过程相结合的思想进行研究,使用特征选择技术增加集成学习过程中的基分类器的差异性,提高集成学习的性能,提出一种特征选择与集成学习相结合的FSSA算法,通过实验验证了其有效性。将算法应用在数字乳腺图像肿块检测的分类模块中,有效地提高了肿块检测的整体性能。