民声通道数据仓库的设计与实现

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:licx1010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:该文给出了民声通道数据仓库的设计与实现方案,对不同数据源和不同格式的数据进行抽取、清洗、集成、转换和加载,最后建立了民声通道数据仓库,并且对民声通道数据仓库进行OLAP分析,将数据信息结构详细分析并可视化呈现。
  关键词:数据仓库;OLAP分析;民声通道
  中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2013)16-3663-03
  数据仓库是决策支持分析的基础,数据仓库的建立包括确定决策主题、目标物理库设计、实现数据装载和联机分析处理四个方面内容。民声通道系统是一套集网站、热线、电子邮件和短信功能为一体的电子信访系统。该文以抚州市民声通道系统为例,详细论述了民声通道数据仓库建立的基本原理和具体实践过程,并在此基础上进行联机分析处理对民声通道问题结构进行系统直观分析。
  1 分析
  1.1 原始数据分析
  1.2 数据仓库的概念模型设计[1]
  维度表和事实表的设计是数据仓库构建的核心,维表和事实表设计直接影响到数据仓库的响应时间和效果分析的关键问题。维是决策者分析对象的角度,这样的维的设计最能分析决策者的意图和角度。它必须体现出数据仓库中数据的不同层次,也就是数据的粒度。我们可以根据分析主题组织事实表和维度表,下面是采用信息包图方法为民声通道数据仓库建立的概念模型。
  1.4 数据仓库的物理模型设计
  数据仓库的物理模型[2-4],用于实现数据仓库的逻辑模型,主要是为了解决数据的存储结构、表结构的定义、数据的索引策略、存储分配等问题。在民声通道数据仓库设计中, 我们以信息包图和星型模型为基础设计各个表最终结构,并且确定事实表、维度表和具体情况表之间的关系最终形成事实表/维度表关系基本结构, 然后再考虑索引策略、数据存储位置及存储分配等。最后我们用SQL Server 平台建立数据仓库的基本结构。在实施过程中还需要完成数据仓库与业务处理系统的接口设计,形成数据仓库物理仓库与元数据库,完成对数据仓库数据的初次加载,从而建立决策支持系统应用。
  在数据加载前,首先需要对数据按照源数据的定义进行格式化清理,然后在清理完毕后,将从源数据转出的数据加载至数据仓库环境中。这些加载工作都是通过ETL调度工具通过运行特定的ETL作业实现的。
  2 民声通道数据仓库的实现
  设计数据仓库,首先应分析原始数据,使用SQL Server Management Studio设计数据仓库,然后定义数据源,进行数据抽取,完成数据源到目标数据仓库的映射,最后调试,即数据加载成功。
  2.1 数据源定义
  2.2 设计和使用ETL
  设计好了结构良好的数据仓库,并且将需要分析的业务数据转载到了数据仓库中后,就为满足决策分析的全方位需求打下了根基。但是对数据的多维分析,主要是针对数据仓库中提取的子集,如数据集市和多维数据集。
  2.3 联机分析处理
  将多维数据集与EXCEL工具结合,能方便地进行OLAP操作及将结果通过报表、图形等多种方式进行可视化展现。
  3 小结
  本文首先介绍了数据仓库设计的基本原理及设计思想,其次重点介绍民声通道数据仓库的具体设计与实现,最后进行数据分布展示和相关OLAP分析,对信息结构进行系统分析与研究。
  参考文献:
  [1] 胡海员.数据仓库与数据挖掘技术在招生决策中的应用研究[D].南京:东南大学,2006.
  [2] Paulraj ponniah.数据仓库基础[M].北京:电子工业出版社,2004.
  [3] 林宇.数据仓库原理与实践[M].北京:人民邮电出版社,2003.
  [4] 刘李法.基于数据仓库的图书馆决策支持系统的研究与实现[D].南京:东南大学,2005.
其他文献
胎衣不下是奶牛产生的一种常见病.一般母牛产后经过8-12h胎衣尚未全部排出即可定为胎衣不下。其发病率与饲养管理水平关系密切,我国平均发病率在10%左右。而有的奶牛场可高达40%
对内蒙古地区捕食性昆虫进行了一次较为系统的调查,这项工作从1982年开始,曾于1991年作过“捕食性天敌昆虫种类”的初步报道,在此基础上又历经了10余年相应的后续工作,使该项
芝麻是优质油料作物之一,芝麻油素有油中之王的美誉。近年来,由于国内外天然食品和健康食品热的发展。人们越来越注意到芝麻的营养价值,需求量不断增加,价格不断上涨。因此,抓好半
根据豆科牧草生长规律及田间杂草危害特点,从2003年起进行化学除草剂防除杂草的试验,试图通过对比筛选出一种高效、广谱、低毒、低成本除草剂,并且对除草剂喷施的剂量及确定
通过对马家咀-黄珏地区钻井岩心的系统观察和研究,作者认为,扇、湖组合是区内下第三系渐新统的主要沉积相。戴南组一段和戴二段下部砂体为近岸水下扇;戴二段上部砂体为滨湖冲
该文主要对GSM移动通信网中常见的几种干扰进行分析,对干扰的原因及解决方法作一简要介绍,通过对干扰的认识指导我们的日常优化工作,以便在发现网内存在干扰时能快速定位,制
草坪具有过滤尘埃、净化空气,调节温度、改善小气候。减弱声的传播、降低噪音等功效。随着改革开放和社会精神文明的发展,草坪日渐为人们所喜爱和重视,阜新市草坪覆盖面积也迅速
彩椒是冀西北山区近年发展起来的设施栽培特色高效蔬菜,由于该区域海拔高,气候冷凉,适宜彩椒越夏错季生产,大部分产品出口到东南亚和欧洲市场,平均产值1.8万~2.5万元/667 m2,
期刊
图像处理在地学数据处理中是一个强有力的工具。运用图像,诸如物化探数据,地质数据,遥感数据等各种地学数据的支撑点都可以统一起来。从图像中采样用于专家系统,就可以使地学数据
本文介绍了利用X射线荧光技术在萨尔布拉克金矿区现场开展地质研究等方面综合应用的一些事例,说明将荧光技术和地质、物化探成果有机结合能扩大其在金矿区的应用范围。