基于局部因果关系分析的隐变量发现算法

来源 :第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议 | 被引量 : 0次 | 上传用户：jiangxiaohui

【摘要】

：

【作者】

：

姚宏亮吴立辉王浩李俊照

【机构】

：

合肥工业大学计算机科学与信息学院合肥 230009

【出处】

：

第十三届中国Rough集与软计算学术会议、第七届中国Web智能学术研讨会、第七届中国粒计算学术研讨会联合学术会议

【发表日期】

：

2013年4期

【关键词】

：

隐变量马尔科夫毯扰动学习因果关系分析因果结构熵

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

　　结构分析的隐变量发现方法难以有效地发现隐变量且可解释性较差。基于因果关系和局部结构的不确定性,提出了一种基于局部因果关系分析的隐变量发现方法(LCAHD),LCAHD方法给出了因果结构熵的定义,将因果知识和不确定性知识相融合,以因果关系的不确定性程度作为隐变量存在的判定依据,并对这一依据进行了理论上的论证；LCAHD方法首先寻找目标变量的马尔科夫毯提取局部依赖结构,然后基于扰动学习获得扰动数据,联合扰动数据和观测数据学习局部依赖结构中的因果关系；进而,利用因果结构熵对局部因果结构中因果关系的不确定性进行度量,并利用隐变量和因果关系不确定性之间的相关性判定条件,确定隐变量的存在性；最后,给出隐变量发现算法。分别针对标准网络和股票网络进行了算法的实验,结果表明该方法能准确地确定隐变量的位置,且具有较好的解释性。

其他文献

基于粒分布的SVM加速训练方法

粒度支持向量机(Granular support vector machine,GSVM)通过选取粒的代表点构成精简训练集以提高支持向量机(Support vector machine,SVM)的学习效率,然而选取个别代表点有可能丢失部分重要分类信息,导致模型泛化能力不高。针对这一问题,提出基于粒分布的GSVM(Distribution based GSVM,DGSVM)加速训练方法,该方法依照粒

会议

支持向量机粒度支持向量机粒分布DGSVM算法

离散粒子群优化算法的构建及其应用

科学与工程实践中一大类问题都可以归结为优化问题，粒子群优化(PSO)算法作为一种新型的群智能优化算法，算法简单易实现，可调参数少，已得到广泛的研究与应用。本报告介绍了PSO算法的基本原理和更新机制，论述了离散PSO算法的研究进展和应用情况，介绍了几种离散化策略的建立、更新方式、计算模式和特点。最后介绍我们在离散PSO算法的构建及其应用情况，分享相关的研究成果和体会，并讨论了离散PSO的发展趋势和进

会议

不完备信息系统中测试代价敏感的可变精度分类粗糙集

在不完备信息系统中，可变精度分类关系是限制容差关系的改进形式，但其并未考虑数据集中属性的测试代价。为解决这一问题，提出了基于测试代价敏感的可变精度分类粗糙集模型，并将其与基于容差关系、非对称相似关系的粗糙集模型以及传统可变精度分类粗糙集模型进行了对比分析。进一步地，通过分析利用传统启发式算法求解约简未考虑测试代价以及利用回溯算法求解约简的时间消耗问题，提出一种新的属性重要度测量，并在此基础上设计了

会议

属性约简不完备信息系统测试代价变精度分类粗糙集

关于大数据与粒计算研究的一些思考

智能信息处理是人工智能研究的主要内容之一，而不确定信息的表示与分析是智能信息处理的重点与难点。粒计算(Granular Computing)是近年来计算机领域出现的一种以模拟人类处理信息机制的计算理论与方法。该理论认为信息或知识是有粒度的，信息或知识的不确定性是由于粒度太粗产生的，它对不确定性给出了新的解释。本报告将介绍一种具体的粒计算模型——粗糙集理论，以及知识约简中不确定性的分析。目前，大数据

会议

名词性数据最小测试代价属性约简的模拟退火算法

最小测试代价属性约简问题是数据挖掘和机器学习中的重要问题。最近，一个信息增益算法被设计用于解决该问题，但该算法的效果并不理想。提出一个模拟退火算法解决最小测试代价属性约简问题。算法首先随机产生一批属性子集作为原子解。然后每个原子解通过简单的方法产生其邻居解。再按照Metropolis准则保留原始原子解或者用其邻居解来替换。最后选出这批原子解中测试代价最小的作为结果输出。该算法在四个UCI数据集上运

会议

代价敏感学习模拟退火算法正区域最小测试代价属性约简

基于群体智能的半结构化藏文文本聚类算法

为了将群体智能技术应用于半结构化的藏文Web文本聚类中，提出了基于群体智能的半结构化藏文Web文本聚类算法SCAST (A Semi-structured Tibetan Text Clustering Algorithm Based on Swarm Intelligence)，充分考虑群体智能技术对藏文文本聚类准确性和时间效率的影响.SCAST算法包含三个主要步骤：(1)运用向量空间模型表示藏

会议

群体智能藏文聚类技术群体相似度

基于动态商拓扑模型的最佳路径查找算法

由于路径本身的动态性、异构性、脆弱性和不确定性，如何在大型加权网络中找到可信路径成为近年来最佳路径查找算法的研究热点。借鉴贝叶斯认知模型和商空间理论，通过对大型加权网络中节点信用度进行评估，提出了一种动态商拓扑模型并应用于最佳路径查找。仿真结果证实，提出的动态商拓扑模型能够在较小的时间花费代价下有效地提高算法可信方面的需求。

会议

路径查找动态商拓扑模型加权网络

基于概率密度估计的增量支持向量机算法

增量支持向量机(Incremental Support Vector Machine,ISVM)模型通过每次加入一个或者一批样本进行学习,将大规模问题分解成一系列子问题,以提高支持向量机(Support Vector Machine,SVM)处理大规模数据的学习效率,但传统ISVM (Traditional ISVM,TISVM)模型中增量样本的选择方法不当可能降低其效率和泛化能力。针对ISVM中

会议

支持向量机PISVM模型增量样本选择概率密度分布

形式概念的布尔计算方法

形式概念分析是用于知识表示和知识发现的一个重要方法。本文将布尔矩阵方法引入形式概念分析之中，提出布尔形式背景的概念，利用布尔向量和布尔矩阵的蕴含运算，给出了布尔形式概念的定义，研究了布尔形式概念的计算和性质。同时，针对布尔形式背景的与、或和乘积运算，研究了对应的布尔形式概念的计算问题。

会议

布尔向量布尔矩阵形式背景概念格

基于决策形式背景的主观贝叶斯概率推理

概率推理是进行数据分析的重要理论工具，利用专家经验值的充分似然率和必然似然率可以进行主观概率推理。以主观贝叶斯概率推理理论为依据，讨论了决策形式背景中条件属性与决策属性之间的关系，将推理方法推广到包含度的形式，得出了无需先验概率的包含度计算方法。

会议

决策形式背景i-条件属性集概率推理包含度

基于局部因果关系分析的隐变量发现算法

与本文相关的学术论文