数据仓库中主题搜索和实化视图技术的研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:xiaoxi0504
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据仓库DW(Data Warehouse)的目的是要建立一种体系化的数据存储环境,将分析决策所需的大量数据从传统的操作环境中分离出来,使分散的、不一致的操作数据转换成集成的、统一的信息,企业内不同单位的成员都可以在此单一的环境之下,通过运用其中的数据与信息,发现全新的视野和新的问题、新的分析与想法,进而发展出制度化的决策系统,并获取更多经营效益。当前数据仓库研究的热点问题主要有:主题的设定;实化视图的选择;实化视图的维护;联机分析处理OLAP(On-Line Analytic processing);联机数据挖掘OLAM(On-Line Analytic and Mining);查询优化等等。首先,本文提出了一种新的主题搜索算法SSVC(Subject Searching Based on Characteristic Value)。该算法能够比较客观的搜索出最具有主题特征的表。该方法通过和需求分析得到的主题进行比较,判断需求分析和设计的客观性,帮助设计人员更有效的设计主题。另外,还可以对未知的关系数据库进行快速分析,找出最具有数据仓库主题特征的表,有效的辅助数据仓库设计人员确定主题事实表。其次,提出了一个新的选择实化视图的价值模型,并在该模型的基础上提出了实化视图选择算法PBPUS。该算法通过预处理得到候选视图集合,这样做的原因是缩小实化视图选择的空间。在维数很多的情况下,可以大大减少视图代价的计算量;然后根据新的价值模型计算出候选视图集合中视图的代价,利用改进的BPUS算法选出应该被实化的视图。新的价值模型通过考虑视图的查询频度和更新频度,再结合时间因素和空间因素,对原有的价值模型进行了改进。该算法与原有算法相比,降低了视图搜索的时间,减少了实化视图更新维护的代价,提高了实化视图的查询效率。再次,提出了基于时间戳的动态视图维护算法TS-DMV(Dynamic Maintenance Technique of Materialized View Based on Time Stamp)。该技术采用版本链控制技术,通过时间戳的控制进一步使视图更新和查询的同步进行,有效地解决了由于OLTP更新事务和OLAP事务同时访问数据所发生冲突的问题,在满足视图联机实时维护的同时,更好的提高了数据仓库的新鲜度和OLAP的查询效率。实验结果表明,本文提出的三个算法优于现有的同类算法,实现了预期的研究目标。
其他文献
闻名吕梁的汉高山脚下有一个小村庄——圪针湾,村里有一位年近八旬的女共产党员。就是这位老人,用自己的实际行动为人们学习的榜样。老人的名字叫秦拖则,在她还不到10岁时,父
形式化方法是一种用数学方法来描述和验证目标软件系统性质的方法,它通常用形式规格说明语言来描述软件需求。由于用数学符号描述的软件规格说明比较抽象,而且是不可执行的,因此
追求跨越式与可持续发展是企业发展的共同目标,要实现这个目标就必须在企业内部数据集成的基础上,将企业内部所有的应用系统进行综合集成。针对现代企业信息化建设中的问题,
目的 探讨中西医结合综合康复方法治疗慢性阻塞性肺疾病的临床疗效.方法 选取我院2018年1月至2019年6月收治的120例慢性阻塞性肺疾病患者参与本次研究,根据不同的治疗方案将
目的 分析血透室内护士的主要职业压力源以及和情绪状态之间的相关性.方法 随机抽取2018年1月至2019年6月我院47例临床护士,以其工作科室为标准分组,通过问卷法进行职业压力
目的 观察探讨在老年性骨质疏松髋部骨折患者的治疗中,采用三期辨证中药复方对其骨代谢标志物的影响.方法 选择来我院来接受治疗的老年性骨质疏松髋部骨折患者88例作为本次研
嗜酸性粒细胞性肺疾病可伴有或不伴有外周血中嗜酸性粒细胞的增多,此类疾病的临床表现多样化,缺乏明显的特点,本文通过对病患的研究分析,PET-CT提示左肺癌伴多发淋巴结转移,
随着多媒体技术的不断成熟,人们对多媒体信息的处理方式产生了新的、更高的要求,更加注重多媒体系统的交互性和灵活性。传统的视频编解码技术是基于帧的,而MPEG-4编解码标准
随着移动互联网时代的来临和物联网技术的不断发展,越来越多高校的信息技术相关的专业都相继推出嵌入式和物联网相关课程,现有的软硬件设备已经无法满足这类课程的教学与实验需
前一段时间,新闻联播的声音传遍全国,国人可以投资港股了!几天之间,很多人来到天津,住在宾馆里焦急地等着开户细则的出台,听说居然有背着几十万现金来的。对港股的投资热情非