基于数据挖掘的智能决策研究

被引量 : 0次 | 上传用户:wuzhigang3481
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今科学技术的飞速发展,使得数据库的规模日益扩大,存储的数据量急剧增加。因而,迫切需要有新的、更为有效的技术和工具对各种数据信息资源进行开采以发挥其应用潜能。知识发现和数据挖掘技术正是在这样的应用需求背景下产生并随着决策系统的推动而发展的。本文从系统工程进行决策分析的角度出发,借助数据挖掘技术中粗糙集的基本理论,在智能决策框架的指导下,研究了基于数据挖掘的智能决策理论及方法。主要理论包括:①如何利用粗糙集对典型的决策系统即相容性决策系统和不相容性决策系统运用不同的数据挖掘方法进行有效的数据约减和规则提取;②在增量动态的数据库环境下讨论了在典型决策系统中对原始数据和增量数据进行数据约减的方法;③分析了带有优先权属性的粗糙集数据挖掘方法;④以基本粗糙集为基础探讨了粗糙集扩展模型的数据分析方法;⑤研究了粗糙集数据预处理方法。主要研究工作及创新如下: 1.将决策系统分为相容性和不相容性决策系统,针对不同系统的特点提出不同的挖掘模型。 对相容性决策系统从两个角度作为启发式信息对条件属性进行数据约减。第一种方法利用了知识的不可分辨性,并以逻辑推演的方式对决策表进行数据浓缩;第二种方法利用了知识的粒度,并以概念的提升方式对决策表进行数据浓缩。在不相容决策系统中提出了两种改进算法即决策概念包含法和粗糙重复组法对不相容的决策系统挖掘出具有一定可信度的分类规则。 2.在增量式动态数据库中,提出了相容性和不相容性决策系统的数据挖掘模型。 在相容性决策系统中,利用决策矩阵提出改进的处理多元决策属性值的数据挖掘模型,可方便地对增量的数据进行直接处理就可得到基于全局数据集合的分类规则,并对可能性规则的可信度进行了初步探讨;在不相容性决策系统中,利用GDT表与RS概念的结合,提出利用三个参数即归纳强度、噪声、隶属度判别指标确定分类规则的强度,通过属性的概念归纳,在一定的概率条件下产生分类规则,并能有效地处理增量式的数据。 3.针对条件属性的等价关系和优先二元关系特性,提出了改进的带有优先权属性的粗糙集数据挖掘模型。 论文在粗糙集拓广理论的基础上,利用属性的有序特性即优先二元关系,提出有序属性的数据挖掘改进算法,使基本粗糙集和带有准则的粗糙集在挖掘分类精度上达到统一,且挖掘出的规则简练、更具合理性和综合性。 4.建立了粗糙集与概率统计和模糊理论的拓展模型。 利用数据的统计特征,将概率测度与分类规则结合起来,提出了相应的知识西北工业大学博士学位论文约减算法;利用模糊属性集合的特点,把粗糙集合与模糊集合有机结合起来,将粗糙集中分辨矩阵的思想引入到具有隶属度属性的隐式决策系统中进行数据约减。 5.利用数据的分布特征,提出了一种改进的领域独立的数据预处理模型。 该模型利用xZ统计值测度进行属性离散化,并提出了对条件属性值的分段间隔首先进行初始化分段算法,使其之后的归并工作大大减少,并以不一致性水平阂值作为停机条件,提高了离散化速度。 6.将本文理论部分提出的数据挖掘核心模型应用到电信CRM的客户挖掘中。 将本文提出的数据挖掘核心模型应用于电信CRM的客户挖掘中,主要对电信CRM中的客户行为进行了分组,提出了大客户识别和划分的依据,初步验证了论文相关方法的正确性和有效性。
其他文献
<正>本·拉登这位恐怖主义大亨的死去,明显波及到中国的反恐局势。伊斯兰激进势力扬言全球报复、"东突"分子回流新疆、美国反恐减压等诸多因素影响着中国的反恐新局5月6日,在
<正>一年一度的全国两会一直是媒体报道的重点,也是报道的难点。两会议题均关乎国计民生,信息量大, 富有新闻价值。但在两会报道中,媒体既面临国内同业的竞争,也要与境外媒体
我国1979年刑法典没有侵犯商业秘密犯罪的规定,仅用行政的、民事的、经济的手段对商业秘密进行法律保护是一种不完全的保护。为了更有力地保护商业秘密权利人的合法权益,维护市
蒙元贵族对印章的大量需求、异族文化情趣对汉族文人的影响等因素相互作用 ,促进了元代文人对印章制度的探讨 ,促进了印文内容和用印方式的变化 ,促进了印章材料的多样化择取
<正>教学内容课程标准实验教材(苏教版)第四册第一单元《有余数的除法》第二课时。教学目标1.使学生进一步理解余数的意义,会用竖式计算有余数的除法,理解并掌握有余数除
整合型医疗卫生服务体系研究与实践重点针对以下三个问题进行深入研究:一是通过对11类社区常见疾病医疗共同体内管理模式的研究,为提高医疗卫生工作效率和服务质量,确保为广大人
2007年中国政府提出"生态文明"建设以来,已批准了三批52个生态文明建设试点.生态系统与社会经济发展的复杂性要求科学、客观地评估区域生态文明建设,以便科学地决策和行动.区
以江苏省徐连、沿海、宁镇扬、沿江和太湖5个经济区及其9个代表县市区域为研究对象,基于"社会-生态-经济"的系统分析,建立了包括目标层、准则层和指标层3个层次多指标的农业
<正>(一)中国转型期危机的特点及其原因 中国目前的危机事件已进入高发期,并呈现出频次高、规模大,组织性强、危害性大,危机波动方式多元、国
<正>全国“两会”年年开,“两会”报道年年搞。对媒体来说,每一次都是一个崭新的考验;如何才能出新,如何才能做到年年岁岁会相似,岁岁年年“话”不同?