混合数据知识发现的粗糙计算模型和算法

被引量 : 0次 | 上传用户：panda_chris

【摘要】

：

机器学习和知识发现是人工智能最重要的研究方向,而复杂环境下信息的不确定性和不一致性是知识发现面临的主要困难。粗糙集理论模拟了人类认知推理中粒化和近似的特点,是刻画

【作者】

：

胡清华

【发表日期】

：

2008年期

【关键词】

：

混合数据粗糙计算分类排序信息度量

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

机器学习和知识发现是人工智能最重要的研究方向,而复杂环境下信息的不确定性和不一致性是知识发现面临的主要困难。粗糙集理论模拟了人类认知推理中粒化和近似的特点,是刻画分类数据的不一致性程度的有效数学工具,已经成功应用于符号数据知识发现,但是还没有系统研究广泛存在的符号、数值和模糊变量共存的复杂分类问题。本文提出在人类的思维中存在6种决策的一致性假设。基于粗糙计算方法论中粒化和近似的思想,本文分别建立了这些一致性假设的数学模型,并给出了一般形式。具体从以下几个方面进行了探索:第一,提出了度量空间多粒度分类学习的邻域粗糙计算模型和算法。度量空间中点的δ邻域形成了论域的一种粒化结构,基于邻域粒化建立了度量空间的邻域粗糙集模型,形成了度量空间分类分类一致性的粗糙计算模型。邻域的大小可视为分析分类的粒度,改变邻域的大小可形成混合数据分类一致性的多粒度分析工具。基于邻域粗糙集模型设计了边界样本选择算法和混合数据属性约简算法。第二,提出了混合数据分类分析的核模糊粗糙计算模型和算法。当前模糊粗糙集的研究主要集中于模糊近似算子的构造,忽略了对模糊粒化结构的分析。研究发现一大类核函数计算的核矩阵都满足模糊等价关系的性质,从而可引入这些核函数为模糊粗糙计算建立模糊粒化结构。本文提出了基于核函数粒化的核模糊粗糙集模型,建立了分类模糊一致性分析的数学模型。设计了基于核近似的混合属性重要度评价指标,探讨了模糊依赖度函数和特征评价算法ReliefF之间的关联,提出了抗噪声的属性约简算法和大样本集的样本加权重采样方法。第三,提出了混合数据描述的有序决策问题的模糊偏好粗糙分析模型。有序分类学习是一大类分类学习任务,在多标准决策分析中具有重要的地位。本文引入多标准决策分析中广泛使用的模糊偏好关系,并将其与广义的模糊粗糙集模型结合起来,从而建立了混合数据排序一致性分析的模糊粗糙计算模型。第四,给出了一系列粗糙计算模型的一般形式,统一了Pawlak粗糙集、邻域粗糙集、核粒化粗糙集和模糊偏好粗糙集,从而建立了粗糙数据分析的统一视角。并且基于一般模型,提出了各种近似空间的不确定性的统一度量模型。分析表明多种近似空间的不确定性程度都可以采用这一信息函数进行刻画。由此,本文给出了混合数据描述的一般分类问题和有序决策问题的一般信息度量理论。第五,本文分析了各种粗糙集属性评价指标的参数和样本稳定性。研究表明,信息熵和模糊信息熵是非常稳定的属性评价指标,少量样本的扰动不会对属性约简产生影响,而邻域依赖度和邻域一致性是不稳定的评价函数,评价结果易受样本扰动影响。第六,设计了混合数据约简的算法平台,测试了各种算法在真实分类中的性能,并提出采用选择性集成方法利用多个约简的互补信息。某些决策系统可以得到一组约简,每个约简都保持了原始数据分类的一致性,提供了分类数据的一种理解视角。基于选择性多分类器集成的研究成果,本文提出有选择地集成部分约简训练的分类器构造多分类器系统,并且设计了前向贪心选择和后剪枝的分类器选择策略,试验表明该方法能够获得相对紧凑并且分类能力很强的多分类器系统。本文的研究建立了符号和数值数据共存的混合决策系统的粗糙计算模型。基于邻域粗糙集模型和核粒化的模糊粗糙集模型,本文建立了混合数据一般分类问题的统一计算模型。接下来又基于模糊偏好粗糙模型建立了混合数据有序分类问题的粗糙计算模型。最后,本文基于广义的粗糙模型统一了一般分类问题和有序分类问题的粗糙计算模型,并为各种粗糙计算模型提出了统一的信息度量理论,从而形成了一大类决策问题的粗糙计算理论。

其他文献

农业灌区信息化系统的设计与实现

针对我国农业灌区信息化管理的发展现状,利用现代信息技术,深入开发和广泛利用灌区管理的信息资源,包括信息的采集、传输、存储和处理等,系统地阐述了灌区信息化建设的基本内

期刊

灌区信息化采集传输存储监控

大学英语交互式课堂教学模式的设计与实践

大学英语的教学目标是在培养大学生的英语综合运用能力、特别是听说能力的同时,全面提高综合文化素质,培养创新能力。交互式教学模式在大学英语教学实践中的运用,能改变传统

期刊

大学英语交互式课堂教学教学策略

关于金融资产相关问题的探讨

近年来,随着市场经济飞速发展,我国适时推出了《企业会计准则第22号——金融工具确认和计量》,以适应金融市场的发展需要。但在该《准则》的应用过程中,也出现了一些问题,尚

期刊

公允价值计量金融资产减值建议及措施

埃森哲公司犹如大学堂

<正>要让咨询顾问在一线作业时始终发挥最佳战斗力,体现出创新能力和解决问题的精神,个人学习能力的强弱和公司所提供培训的好坏直接决定了员工的工作成果。在埃森哲知识分享

期刊

埃森哲大中华区知识管理系统大学堂

信息系统综合评价的灰色层次分析法

将层次分析法与灰色综合评价法相结合 ,建立了信息系统综合评价的灰色层次分析模型 ,论述了灰色综合层次分析法的基本步骤 ,给出了一个灰色综合评价案例。

期刊

灰色评价法层次分析法综合评价评价模型信息系统

路基承载力的评定

提出了现行路基承载力评定方法存在的问题,通过介绍落锤式弯沉仪(FWD)和动态圆锥贯入仪(DCP)使用原理及各自优缺点,运用FWD和DCP结合工程实例对路基承载能力进行对比评定分析

期刊

落锤式弯沉仪动态圆锥贯入仪路基承载力

通过发酵策略及诱变选育来提高谷氨酰胺转胺酶酶活

微生物谷氨酰胺转胺酶(Microbial Transglutaminase,简称MTG,EC 2.3.2.13)能催化多种蛋白质分子间、分子内的酰基转移反应,改善各种蛋白质的功能性质,在食品、化妆品、制药等

学位

吸水链霉菌谷氨酰胺转胺酶指数流加溶氧浓度诱变2-脱氧-D-葡萄糖

崔琰被杀原因考辨——兼论曹操的用人

<正> 《曹操论集》及近几年一些论著,对崔琰的死因无人专门论述,仅散见于某些论著中的观点也很混乱:或言是因为曹操平冀州后崔琰犯颜直谏而得罪了曹操,曹操“心中不平”,终以

期刊

曹操士族世族张绣

2001十大热点案件点评

期刊

新浪网死刑犯生育权民事案件侵权行为精神损害赔偿金名誉权悬赏广告肖像权热点案件

网上超市购物体验影响因素研究

近年来网络购物人数和交易金额持续快速增长,在这样的背景下,网络购物过程中的体验显得尤为重要。本文以网上超市为研究载体,在综述国内外学者关于网络购物体验以及消费者行

期刊

体验营销网购体验消费行为

混合数据知识发现的粗糙计算模型和算法

与本文相关的学术论文