面向海量数据的云存储系统实现与应用研究

被引量 : 0次 | 上传用户:embedwince
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网、移动互联网和物联网的发展,网上的用户数量日益增加,数据也呈爆炸性增长,海量数据的时代已经来临,尤其是在互联网、电信、金融等行业,几乎已经到了“数据就是业务本身”的地步。面临如此海量的数据,首先摆在眼前的问题就是:这种数据的大小已经超出了单个机器的负载能力,如何构建大规模、高效率、易于扩展、高可靠的存储系统,是迫切需要解决的问题;其次在信息社会,信息是至关重要的,在海量数据中,有一个重要的趋势,即数据的社会化,这也是我们通常所说的非结构化数据(例如:文本、图像、音频、视频等),如何从海量数据中获取有用的信息,也成为近年来互联网的一大挑战问题。基于上述提出的问题,本文对海量数据存储及海量数据挖掘做了调研。由于网络中数据的表现形式是多种多样的,为了方便研究,本文以科研工作者管理文献为例,将海量数据来源具体化为网络中的电子文献数据。在此基础上,本文通过云存储和云计算平台,成功搭建了一个面向海量文献数据的云存储系统,该系统实现了文献数据管理与分析。系统首先需要用户注册,然后用户可以上传文献(如PDF文件)存储在云端,接着用户便可以管理自己上传的文献,如增加文献、删除文献等,同时系统还提供文献信息检索和聚类分析功能。
其他文献
近年来,国家对非物质文化遗产的重视,越来越明显。一个普遍的现象是,大大小小的晚会上总有那么一两个原生态歌手粉墨登场,甚至像中央台主办的青年歌手大赛这类全国性的赛事也
拟建渝昆高速铁路重要比选方案会泽至嵩明段平行小江活动断裂,地形地貌及地质条件极为复杂。通过对内动力地质灾害(活动断裂及高烈度地震)、重力地质灾害(滑坡、崩塌、泥石流、
随着新课程改革的全面铺开,一线教师的教育行为都发生巨大的变革。作为母语教学的语文课程,也将从过去的“耗时多、效率低”的批判声中走出,以全新的面目呈现于学生的面前。
<正> 近年来,随着优生优育工作的开展,人们对新生儿保健的要求越来越高。有些家长常因不了解新生儿的生理特征,新生儿在喂养过程中稍有点变化便抱去就医;还有些家长随便给新
在伪满洲国统治东北的十四年中,新闻出版事业陷入畸形的发展状态,沦为日伪当局控制舆论、殖民思想的重要手段。在这其中,新闻法制究竟起到怎样的作用?本文从史与法相结合、微
台湾加入亚投行后,将对岛内经济发展和两岸经济关系进一步深化带来新的契机,也将为台湾融入区域经济一体化提供新的平台。但由于台湾当局的观望心态、民进党的恶意掣肘以及美
以屠宰废水为原水,对生物膜-活性污泥共生系统的传质机理及工程应用进行了分析.该工艺以形成泥膜共生系统为基础,通过受限工艺约束多相流的水力半径,从而强化物系的宏观和亚
受美国几年前次贷危机影响,我国商业银行信贷风险呈上升趋势。作为商业银行主要收益来源的银行信货业务,是构成商业银行信货风险的重要因素。如何有效规避、防控信贷风险,已
详细介绍了差分GPS静态测量和动态测量两种测量模式应用于大范围地面沉降监测的工作原理,探讨了GPS测量与水准测量,这两种方法因测量基准面不同,而使得所测地面沉降量存在的
在大规模光伏发电的情况下,光能转化为电能效率的高低直接影响光伏发电能力。不同的环境条件下,光伏发电的能力也不同,考虑温度和光强的影响,探究出不同的最大功率点,根据环