论文部分内容阅读
为了解决数据挖掘算法的高效性、工具智能性与所获取知识无效性之间的矛盾,同时使所获取知识能有效地解决地层评价领域中的各种疑难问题,提出任务驱动数据挖掘方法。结合数据挖掘的概念和技术,阐述了任务驱动数据挖掘的概念和基本原理,分为建立数据仓库、数据预处理、选择特征子集、形成模型、模型评估、模型修正和模型发布等7个部分,是一个循环迭代的过程,直到构建能有效解决目标任务的预测模型为止。并以低阻油层的识别为例,详述整个分析处理过程,结合决策树形成的白盒模型和支持向量机构建的黑盒模型综合识别目标区的低阻油层,获得