【摘 要】
:
数据库技术在事务处理方面获得了巨大的成功,但是面对日益增长的庞大数据,对数据的分析处理一直不能令人满意,尤其当以业务处理为主的OLTP应用与以分析处理为主的DSS应用共存
论文部分内容阅读
数据库技术在事务处理方面获得了巨大的成功,但是面对日益增长的庞大数据,对数据的分析处理一直不能令人满意,尤其当以业务处理为主的OLTP应用与以分析处理为主的DSS应用共存同一个数据库系统中,这两种类型的处理发生了明显的冲突.因为事务处理和分析处理具有本质的不同,直接使用事务处理环境来支持DSS是不切实际的.致力于决策支持的数据分析处理,要求数据大量、正确、可靠、完整及聚集程度高.目前的事务处理系统虽然积累了大量的细节数据,却因为规范化的限制,不具备以上分析处理的能力.数据仓库的目标就是在一个企业内将正确的信息发送给正确的个人,同时给企业提供一个可靠的、一致的数据分析环境,是一个动态的过程.全德房地产信息管理系统,经过多年的信息收集,积累了大量的房地产各个方面的业务数据,完全可以为房地产开发商提供一个决策支持的数据环境.因此,该论文以构建一个房地产数据仓库实例为基础,运用数据仓库和数据挖掘技术,为决策人员创建描述性的和预测性的数据分析模型,进行了有意义的理论与实践相结合的探索研究.该文首先对数据仓库理论作了全面的分析,尤其是对数据仓库的结构和数据挖掘基础算法进行了深入细致的研究.然后重点讨论了数据分析系统基于J2EE构架的应用体系结构,以及采用了基于组件的算法描述方法详细分析了最小二乘法拟合的回归预测模型.随后以全德房地产数据分析为例,讨论了数据仓库的设计过程及数据挖掘技术在房地产数据分析的应用,提出了一种中间件式的数据增量更新算法来解决目前数据仓库增量更新任务.最后重点讨论多评估点方法在房地产开发投资评估上的应用及属性分析和回归模式相结合的新的回归预测方法建立租金预测模型,并给出了系统优化方案和实验结果.
其他文献
该文对基于Internet网络的VoIP(Voice over IP)技术实现,提出了一种分布式可扩展的VoIP体系结构,针对语音通信的实时性和交互性的要求,围绕语音分组的延迟、抖动和丢包率等问
科学数据网格是以中国科学院十五信息化建设重大项目"科学数据库及其应用系统"为背景而建设的一个数据网格.科学数据库的特点是:数据库庞大、地理上分布、数据库结构异构.科
为了把大量的业务数据转变为有用的决策信息,该文研究和探讨了商务智能在财政信息化建设中的应用,以及如何将数据挖掘方法运用于财政支出效益分析.首先,详细分析了中国财政信
该文分析了当前国内、外PACS建设面临的主要问题,提出了基于DICOM3.0的PACS组件式结构模型,并比较了国内、外其他的PACS系统.该文深入分析和探讨了基于DICOM3.0的PACS组件式
目前INTERNET上公共信息网页大多数是使用HTML,但现行无线通讯设备只支持浏览WML网页,因此无线通讯设备无法直接浏览现有的HTML网页.该论文设计及编写一个具有过滤器功能的转
该文采取了两种方法从不同的角度提高遗传算法的效率.(1)改进现有的求解组播QoS路由的遗传算法的几个关键环节.针对实编码方式,提出了群体规模应与可选链路最大数相当的原则;根
多维数据可视化技术的基本思想是将数据库中每一个数据项作为单个图元元素表示,数据的各个属性值以多维数据的形式表示,通过向低维空间的映射,大量的数据集构成数据图像,从而
分布对象技术是伴随网络而发展起来的一种面向对象技术.分布式对象是一些独立的代码封装体,远程Client可以通过操作调用来访问它.在分布式环境中的各对象之间只能通过预先定
该文以中远程小目标运动物体为主要研究对象,以二维场景运动物体的监视和目标跟踪为研究背景,对中远程监视系统的各个主要环节进行了研究,针对中远程目标的特点,对现有的各种
随着网络技术的迅速发展,需要存储和传播的信息量越来越大,信息的种类和形式越来越丰富,传统的信息管理机制显然不能满足这种需要,因此人们提出了数字图书馆的设想.元数据是