基于MPI的信息系统知识获取方法研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:du_info26
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实生活中信息系统的属性不仅多样化、维度高、而且包含噪音、冗余和不相关属性,为了消除噪音等对计算过程和最终结果造成的影响,解决数据计算的复杂性和准确性问题,需要选择合适的知识获取方法。随着近年来数据爆炸式增长,并行技术显得越来越重要,并行计算能够提高性能和存储空间,使得单机计算和存储瓶颈得以解决。本论文结合粗糙集理论,运用并行计算的思想对知识获取方法进行研究,旨在将并行计算与粗糙集理论相结合,在解决数据计算复杂性和准确性问题基础上,提高计算性能和计算效率,处理串行算法在对大型信息系统计算时出现的时间过长、内存溢出和宕机等问题。主要研究工作如下:(1)针对连续数据离散化问题,提出了基于MPI和聚类的连续属性并行离散化方法。首先,对信息系统分块,并将数据块分配给各个计算节点;其次,进行并行聚类,对数据进行归一化处理后,基于k均值算法对属性做聚类操作,得到聚类结果;最后,采用几万到几十万不等的数据集进行了仿真实验,实验结果表明:基于MPI的并行聚类离散化算法极大地缩短了串行算法的运行时间,能够用来处理大规模数据,提高计算性能和计算效率。(2)针对离散化数据的知识约简问题,提出了基于MPI和分辨矩阵的并行知识约简方法。首先,分配并行任务,同时计算等价类,得到等价类结果;其次,各节点根据分配到的任务并行构建分辨矩阵,计算属性核,然后,由属性核最终计算得到知识约简结果;最后,采用几百到几十万不等的数据集进行了仿真实验,实验结果表明:基于MPI利用分辨矩阵并行求知识约简的算法在保持约简结果不变的条件下,能够解决串行算法的时间和空间瓶颈,用来处理大规模数据集。本文的并行计算方法很容易拓展,如果增加可用的计算资源,计算速度会进一步得到提升。
其他文献
荒漠草原地区原本无林或者少林,近60年通过植树造林、防风固沙、退耕还林等工程,建设了大量的片林,科学评价他们的生态功能和效益是有效保护和合理建设片林的依据。本研究旨在通过对宁夏盐池县荒漠草原不同面积大小榆树和杨树片林鸟类群落结构的调查,鸟类分类,以及片林树种和面积大小对鸟类停歇的影响,评价他们的生态功能。调查于2018年7月至2018年10月进行,在盐池县北部荒漠草原地区的皖记沟村和沙边子村,选择
随着自动化、计算机等各种技术的不断发展和应用,无人机的技术更趋智能化,结构日趋复杂,功能也更为强大。随着无人机可承担任务越来越广泛,其面临的应用环境也越来越具有非合作性、多不确定性因素、高威胁性、动态化等特点。这对无人机的指挥控制提出了更高的要求,传统的基于地面指控站遥控或基于程序化的自动控制策略已经很难适应未来无人机的任务需求。无人机根据任务要求和实时的战场环境,自主地进行任务规划和决策成为未来
研究目的:以“筋为骨用”理论为指导,以社区膝骨关节炎(Knee Osteoarthritis,KOA)患者为研究对象,运用中医推拿、点穴、中药熏洗联合塞来昔布胶囊为干预手段,观察其临床疗效,
肠球菌(Enterococcus)是一种兼性厌氧性革兰氏阳性菌,属于人和动物肠道内的共生细菌,现已成为主要的机会致病菌。在肠球菌属中,粪肠球菌和屎肠球菌可导致人类和动物的许多感
西藏斯弄多Ag-Pb-Zn矿床大地构造位置位于西藏冈底斯成矿带南缘弧背断裂带上,赋存于林子宗群火山岩中。研究中综合运用了短波红外和岩石地球化学勘查的方法,通过对矿区内不同类型矿体典型钻孔进行测量,厘定了蚀变矿物组合,基于元素迁移量计算的结果,系统分析了蚀变过程中元素的迁移特征,探讨了成矿机制。野外钻孔编录发现,矿体硅化较强,在钻孔中发现隐晶质、石英脉和以石英集合体形式存在的不同赋存状态下的石英。根
对马尔可夫链的理论研究通常是基于转移矩阵已知这个自然的假设的。然而在现实系统中,马尔可夫链的转移矩阵可能是未知的,甚至可能是需要通过部分可观测的数据来确定的。因此,如何通过部分可观测的信息来确定马尔可夫链的转移矩阵这个课题在应用中具有重要的意义。这就是我们说的马尔可夫链的统计确认问题。充分利用马尔可夫链的本质特性和矩阵分析方法,找到某个状态集的生存时间和死亡时间分布与转移矩阵之间的约束关系,再根据
目的:了解我院采用光动力治疗的尖锐湿疣患者的基本情况,探究疗效的影响因素,进一步提高疗效。方法:统计2016.01-2017.08期间确诊于滨州医学院附属医院皮肤科门诊和性病门诊
随着互联网、云计算、大数据等信息技术的快速发展,如何通过数据挖掘获取潜在有价值的知识成为当前的研究热点。其中,频繁项集挖掘是发现事务关联关系,提供推荐、预测等信息
目的:探究趋化素样因子超家族成员6(CKLF-like MARVEL transmembrane domain-containing 6,CMTM6)在胶质瘤中的表达及临床意义,并评估其对胶质瘤细胞生物学功能的影响。方法:
目的:1.探究双肺弥漫性病变患者BALF中SP-A、SP-D的表达水平及对疾病鉴别的意义。2.探究ILD患者BALF中SP-A、SP-D的表达水平对患者疾病严重程度的评估意义。方法:1.选取2017.