【摘 要】
:
在金融领域里,大量的数据如股票交易的高频数据是以流的形式到达的。这些流数据持续到达,速度快,容量近乎无限,传统的数据库技术已经不能很好地处理。将流数据处理引入数据库
论文部分内容阅读
在金融领域里,大量的数据如股票交易的高频数据是以流的形式到达的。这些流数据持续到达,速度快,容量近乎无限,传统的数据库技术已经不能很好地处理。将流数据处理引入数据库中,能提高了数据处理的效能,缓解了金融数据库中的时间窗口瓶颈。频繁项挖掘是流数据处理中一项十分重要的基本任务。许多近似算法能够有效地进行频繁项挖掘。但传统的频繁项算法如Lossy Counting都只能基于元素的计数进行挖掘。无法满足对带权值数据的监控。本论文提出的新算法可以对元素在整个流数据中所占权重比重进行挖掘,输出超出门槛参数的频繁项。输出结果为近似值,误差可以保证不超过给出的设定值。新算法非常适用于金融交易中各种带权值交易的频繁项挖掘。实验证明新算法显著降低了时间和空间的开销。增量式数据库是将流数据处理技术限制放宽后在传统关系型数据库中的应用。利用增量式数据库的设计方法,在计算密集的任务中保存中间结果,将峰值时的计算负载均衡至空闲的时间里,可以大大提高系统的运行效率和响应时间,具有非常大的现实意义。本文在数据领域中引入离线流数据与增量式数据库的概念。对不同限制条件下的在线流数据、离线流数据、增量式数据库三者进行了分析并提出了相应的优化思路。提出的基于权重的流数据频繁项挖掘新算法能有效地应用于在线流数据与离线流数据中,并可作为增量式数据库的预处理手段。增量式数据库作为一种全新的数据库优化技术,在各种具有流数据特点的场合具有广阔的前景。
其他文献
清代史料笔记,由于年代未远而得以较为完整的保存,故其数量之浩繁、内容之博杂,乃为历代之最,其中蕴含着极为丰富的史料研究价值。然而,惜为传统所囿,“笔记”向来被视为丛残
本文对标准汉语普通话、标准越语和越南学生汉语中介语的音高进行分析研究,探索三者各自声调的音高搭配特征,重点研究标准汉语与越南学生汉语中介语静动态声调的语音特征。本
智能电网环境中,光伏系统作为分布式发电机应用时,必须满足并网标准的各种要求。逆变器作为光伏阵列与电网的连接机构,应该具备分布式发电机入网的必要功能。文章重点介绍了
古建筑群旅游的开发,促进了当地经济、环境和社会文化的发展,同时加剧了古建筑群的损耗和地方特色的消失,于是仿古建筑群建设逐渐被人们所重视。作为岳阳楼风景名胜区仿古建
本文报道应用我国标准对200例冠心病(CHD)患者与200例对照组进行性格类型与中医辨证相关性的分析,并与1984年应用非我国标准的结果进行比较。CHD 组中A型性格151例,非 A 型性
Wonderware FactorySuite A2以IAS为核心,集成InTouch、InSQL Suitevoyager,构建了工业自动化和信息化系统的强大基础.在集成了FactorySuite的其他软件,包括ActiveFactory、I
<正>红包营销这张牌大概只能由腾讯系公司来打。一大波红包正在袭来。在微信朋友圈,我至少已看到三种红包:大众点评红包、京东红包、滴滴打车红包。哦,对了,爱国者冯军也在那
新的市场条件下,求职和创业问题逐渐成为很多学者研究的对象。以往的研究中,对求职的研究多集中在农民工、下岗职工等特殊群体的身上,对于城市居民求职网络的研究不是很多;而
2011年6月,承德县上谷乡闫杖子村发现一批铁器,共6件,包括双耳镂空高足铁釜2件,三足铁盘1件,敛口铁罐2件,六耳困底铁釜1件。经对出土器物进行分析,认为该处是一处金代窖藏。本文对这
本文针对喜马拉雅山东部地区特有的地质环境条件,建立了一个灾害危险性评价体系,并详细介绍了该评价体系的建立原则和评价体系中评价因子的选择。并对所采用的评价方法——层