Eole系统算法推荐及数据可视化的设计与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:lunlunyy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的飞速发展,海量信息的处理成为越来越普遍的需求。通常,海量数据的处理要求工作人员学习分布式相关知识,学习成本和开发成本都比较高,而且现有大数据开发平台对于算法的支持相对有限,也不能很好地对运算结果进行图形化展示,用户使用效率较低。另一方面,传统的海量数据处理平台存在搭建困难和安全性低等缺点,越来越难以满足人们对海量数据数据处理的需求。针对这些问题,本文提出了一种开放分布式海量数据处理平台的设计方案。为了解决安全性问题,该平台以HDFS (HDFS, Hadoop分布式文件系统)、Hive和HBase (Hadoop Database, Hadoop数据库)等作为底层数据存储方式,以MapReduce、spark和storm等作为底层数据处理方式,向用户提供了统一的接口,同时使用Kerberos进行权限控制,保证了数据安全性。针对效率问题,一方面采用Kettle开源工具,为用户提供可视化操作界面,方便用户操作,另一方面结合国内外相关机构和实验室在分布式计算,大数据处理,算法集成处理等研究成果和经验,添加算法支持模块,以实现数据处理算法的智能选择和算法参数的智能推荐,同时使用JFreeChart等图表绘制工具,实现运算结果的图形化展示,提高用户数据处理效率。这种开放式的服务使用户可在不同平台不同环境下简单方便地完成海量数据处理任务。本文所介绍的分布式系统是在Hadoop平台的基础上进行的二次开发,保证了系统的通用性,降低了维护和升级的成本,同时统一了操作接口,提供了图形化的操作界面,加强了对算法处理的支持。测试表明该系统可以提高系统的安全性,提高用户数据处理的效率。
其他文献
目前网络管理的方向是向分布式网管理发展.移动代理技术作为一种新型的智能分布式技术,目前已在网络管理领域得到一些应用.在此模型中,网络管理站的功能部分被负荷到被管设备
该文结合分布式虚拟环境,就实体属性定义和实体开发展开深入研究,归纳出DVENET中的实体属性集.在此基础上,该文讨论了采用XML语言描述实体的可行性和优势,提出基于XML语言对
该文在充分分析和研究当前设计过程管理软件的基础上,结合该系统在企业实际应用中的需求,设计了一个分布式的设计过程管理系统,其底层支撑环境采用CORBA组件技术.该文分析了
该文介绍了从一维Gabor变换到二维变换的发展,对一些变换系数的求解方法进行了讨论,由Daugman提出的求解二维Gabor变换系数的神经网络和SOR等算法都有较高的执行效率,同时也
软件测试是保证软件质量最常用的方法之一。按照测试活动发生的阶段,可以将测试分为单元测试、集成测试、系统测试和验收测试。单元测试发生在测试阶段的开始,其它测试是在单元
该文根据COMPAQ公司公布的白皮书(whitepaper)《TheMillicentProtocolforInexpensiveElectronicCommerce》对Millicent微支付协议中交易的过程进行了深入的分析,首先对微支付
随着网络应用的不断发展,网络安全问题也日益突出。越来越多的安全技术被应用到网络安全领域。而绝大多数的安全措施都属于被动防御,缺乏更加积极的保护措施。 入侵检测是网
该文对MBACS算法进行结构上的比较,证明所有的MBACS算法的接纳控制等式可以表示为相同的结构.而且通过这个结构,证明部分MBACS算法使用相同的测量过程,调整它们的参数满足一
作为区域网技术的一种,以太网技术在80年代以来发展非常迅速。从最初的10兆共享式以太网到快速交换以太网,以至到千兆以太网。IEEE新的标准的不断制定不仅给千兆以太网的广泛应
该论文介绍了一种新的可伸缩的安全服务发现服务(Scalable Secure Service Discover Service简称SDS),它是一种能够帮助用户根据各自任务的需求,安全的寻找到相应服务的目录