论文部分内容阅读
众所周知,数据挖掘是一个从海量数据中发现并提取隐藏的、前所未知的、有价值的信息或知识,然后利用这些信息或知识做出重要的商业决策的过程。因此,分析数据库、数据集市和数据仓库中收集的历史数据能够帮助决策者更好地了解他们的客户、评价企业在市场中的地位、提高和改进决策的质量和增加其竞争力。随着理论研究的不断深入和大量的实际应用,数据挖掘的方法逐渐发展成为一门新的学科和技术,它主要包括决策树、神经网络、线性规划、模糊集、粗糙集和支持向量机等方法。
然而,某些现有的确定性数据挖掘方法和模型在解决实际问题时又存在各种各样的局限性,特别是当数据中存在不确定、不精确、不一致、不完整等数据或信息时,这些方法和模型的性能表现较差,有时甚至无法有效地得到问题的解。因此,本文在深入研究模糊集和粗糙集等不确定理论、多目标规划和决策以及分类问题等的基础上,尤其是在客观地分析了这些方法之间存在的互补性的前提下,提出了建立一系列不确定情形下的多目标规划的模型和算法,并将它们用于解决数据挖掘中的分类问题,以提高分类的准确性、分类模型的求解效率和它们在新数据上的泛化能力。
因此,该论文主要研究了不确定情形下的多目标规划分类的各种模型和算法,包括了模糊多目标规划分类、基于粗糙集预处理的多目标规划分类和粗近似多目标规划分类的各种新的模型和算法流程。此外,在全面分析了传统的特征选择方法存在的不足的情形下,提出了基于统计属性贡献度的特征选择模型和算法;同时,尽管粗糙集在属性和信息约简方面具有优势,但是由于一般的粗糙集方法本身所包含的缺点,所以本文描述并给出了一种扩展的、基于粗糙集理论的属性约简模型和算法,它综合考虑了粗糙集的代数和逻辑方法。
最后,通过信用评分和Web客户忠诚度分析的实际应用,其分类结果和与传统方法对比分析的结论表明,不确定的多目标规划分类方法能够显著地提高分类准确率、模型运行的效率以及它们在新数据集上的推广能力。对于上述各种模型和算法的商业应用来说,它们能够较好地改进和提高商业决策的质量和效益。