数据断层现象的研究

来源 :计算机应用与软件 | 被引量 : 0次 | 上传用户:zgkl004
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着各个领域数据量的与日俱增,数据仓库技术在进行海量数据资源的管理过程中,数据断层现象已经成为亟待解决的一个重要问题。断层的概念来源于地质学上对于由储层非均质性而引起的岩石断裂且两侧发生明显位移的构造描述,对能源开采、地震预防等问题具有重大的现实意义。借鉴地质断层的理论,引入数据断层的系列概念定义数据与数据之间发生局部位移的趋势,首次从宏观和微观两方面对数据仓库中的各种数据非均质现象进行知识描述,通过数据断层剖面的分析,系统地阐述数据预处理过程中的数据断层现象,给出数据断层在显隐断层、内间断层之间相
其他文献
新型农村合作医疗(以下简称“新农合”)自试点到全面推广以来,取得了很大的成效,使广大参合农民得到了基本的医疗保障,对农村未来的卫生事业影响将是深远的。但是“新农合”对农村
价值定位既是达致政府公共治理效能评价完善性的必要条件,又是进行政府公共治理效能研究实现科学化的内在要求。政府效能的价值定位问题是公共行政学说史上长期被关注的对象。
内蒙古乌兰察布市叶心医院院长、心外科主任王大成教授,被患者誉为“病魔的克星,病人的救星”,他从事心外科工作20年来,攻克一个又一个医学难题,为乌兰察布市及自治区外科医学事业
非线性结构保持能力的不足是正则正交化的线性判别分析ROLDA(Regularized Orthogonal Linear Discriminant Analysis)在人脸识别中的主要问题。提出一个用于人脸识别的正则正交化的局部Fisher判别分析ROLFDA(Regularized Orthogonal LocalFisher Discriminant Analysis)降维算法。该算法在ROL
针对当前国土资源执法监察工作所面临的动态监测与管理难题,提出一种基于3G和3S技术的国土资源动态监察系统。该系统采用分层结构搭建国土资源动态监察系统的总体架构,使用基于工作流的协同办公和异构数据交换和集成等关键技术。在成都市进行综合应用示范,基于该架构开发与建设了成都市土地执法监察管理系统。通过在成都市及下属20个区(市)县的推广应用结果表明,该系统的推广应用有效遏制违法违规用地的发生,促进执法监
北京市土肥工作站成立于1979年.是北京市农业技术研究、科技成果转化和示范推广的重要单位。近年来,北京市土肥工作站全体科技人员.在站长赵永志带领下,本着对土壤肥料事业的无限
中国中铁二院工程集团有限责任公司(原名铁道部第二勘察设计院,简称中铁二院)成立于1952年9月,2007年完成改制挂牌为国内大型综合勘察设计企业之一,现隶属于世界500强第341位、中
如果说,杜拜(迪拜)危机对世界经济,对中国经济的影响有限,这一判断是对的。但“杜拜模式”之害,不容低估,“杜拜魔咒”降临中国,也不是空穴来风。
实际应用中存在着大量同时具有数值型和符号型属性的混合属性数据,研究混合属性数据的聚类具有重要意义。经典聚类算法仅仅处理数值型数据或符号型属性数据,对混合属性数据往往无效。现有混合属性数据聚类算法分别将数值型属性和符号型属性数据单独计算,忽视了两种属性之间的相关性,聚类效果不理想。提出一种基于图划分的混合属性数据聚类算法。算法将一行属性值定义为一个图节点,计算图节点的相似性,采用一种自适应调节属性权
准确检索出博客空间中人们对重要话题、热点事件的观点看法对市场调研、网络舆情发现与预警等应用有重要意义。博客观点检索的目标是检索出不仅与特定查询主题相关而且包含针对该主题的评论的博文单元并依据观点强度进行排序。首先给出博客观点检索系统的框架,然后给出主题博文检索模型以及博客观点权重的计算方法。实验结果表明:所设计的博客观点检索系统能够有效地检索出对查询主题含有主观观点的博客,具有较好的应用价值。