MapReduce模型相关论文
本次研究基于MapReduce模型在并行式环境中提出一种高性能的计算机数据挖掘算法,将模型输入由原始的一个样本转变为一组样本代以减......
自从Web2.0的兴起,在线社交网络吸引了许多国内外研究者的兴趣。这些社交网络有许多独特的结构性质如度的幂律分布、极短的网络半径......
随着互联网技术和分布式数据存储的高速发展,企业对云平台使用越来越普及。与此同时,人们对于自身存储在云平台的数据安全的关心程......
在电信这个服务型行业中。企业为了在竞争激烈的市场中生存发展,客户关系管理工作的质量显得尤为重要,客户流失预测是客户关系管理......
随着社会进入网络时代,各种各样的网络设备骤增,产生了大量的数据信息,而这些数据大部分是以文本的形式存在的,如何高效快速的处理......
随着Internet的迅猛发展与互联网用户的快速增加,Internet上的数据也呈爆炸式的增长。对于互联网提供商来说,这些海量数据中隐藏着......
边缘是图像最核心的属性,包含了很多有用的数据。边缘检测技术利用图像的边缘信息对图像进行分割获得目标图像,它是图像进行其它处......
因为MapReduce对于处理大规模数据有着很好的可扩展性,所以MapRe-duce成为了云计算中非常流行的一个编程模型。但是,MapReduce在异构......
随着大数据时代的到来,如何高效地分析处理海量数据成为了计算机学科的一个新的挑战。MapReduce就是在此背景下出现并飞速发展的一......
随着信息技术的快速发展,数据在医疗、商业、民生、科研与军事等领域都呈现出爆炸式增长,数据密集型计算环境下数据挖掘算法的研究已......
随着大数据时代的的来临,如何高效地处理海量数据已经是各行各业都要面对的一个无法回避的问题。为了避免在海量数据面前出现“信......
随着数据大爆炸时代的到来,大数据业已成为信息领域的一大研究热点。目前已有不少云计算环境下基于MapReduce模型的分布式处理系统......
随着网络技术的快速发展,各类信息数据的增长速度越来越快,针对海量数据的处理需求,云计算逐渐成为业界的主流计算模式。MapReduce......
互联网的快速发展推动着数据信息呈现着几何式增长,数据占用空间从GB发展到TB甚至PB,飞速增长的数据规模标识着人类进入了大数据时......
随着计算机技术的进步与发展,云计算作为从分布式计算、网格计算和并行计算发展而来的新兴计算模式得到了飞速的发展。云计算把所有......
学位
TSP问题(Traveling Salesman Problem),即旅行商问题,是数学领域里面组合优化问题中被广泛研究的著名问题之一。TSP问题在学术研究......
随着硬件技术的迅猛发展带来了图形处理器的革新,这个原本只是用于图形数据处理的设备现在却变得举足轻重,它拥有高带宽和高度并行计......
随着社会信息化的进程,海量数据迅速出现,许多并行数据挖掘算法已被提出。聚类分析是数据挖掘的一种强有力的分析工具,其显著特征......
Google设计提出的MapReduce并行编程模型有效地把并行程序的编写者从一些琐碎的编程困难中解放出来。程序员无需为并行程序的任务......
随着数据量的不断增长,关系数据分析系统面临着可扩展性和查询性能的挑战,许多查询任务都必须通过使用大规模的集群实现并行处理才能......
21世纪是一个信息化的时代,信息以及数据快速增长,这对计算能力提出了更高的要求,云计算在此环境下应运而生,它带来了新的变革。云......
自2007年云计算诞生至今,它已经逐渐成为国内外IT界热门的概念,得到了广泛的关注。在当今互联网高速发达的环境中,面对数据量的急剧增......
人脸识别作为一种典型的生物特征鉴别方式,已经成为模式识别领域中一个重要的研究方向,具有广阔的应用前景。近年来移动互联网的迅速......
微博是近年来发展最快的网络媒体之一,随着其用户规模的不断扩大,其产生的信息量和社会影响力也越来越大。同时,网络信息的泛滥阻碍了......
作为数据挖掘领域中的一种重要方法,聚类分析能够发现数据对象自然的分布结构。它根据数据对象之间的相似性,把数据对象分割成簇,......
计算机技术发展至今,互联网的普及率也越来越高,已经成为人们生活中必不可少的工具,特别是随着近年来移动互联网的发展,数据需求呈现分......
近年来,随着互联网应用的迅速发展和云计算技术的广泛应用,数据存储量呈现爆炸式增长。如何在大规模数据集中找到人们感兴趣的数据......
网络图是指由网页及网页之间的链接关系组成的图,通过研究网页间的链接关系,抽取有用的信息,多用于爬虫算法,搜索和社区发现等方面......
“智能交通”和“社交网络”越来越普及,然而如何处理这些领域背后复杂图结构的问题迫在眉睫。比如,在“智能交通”中,如何计算两......
随着国内外互联网的广泛应用,社会得到了飞速发展。企业和智能终端每天都会产生大量的生产数据、网络社交数据等,传统的数据挖掘算......
随着技术的发展,数据的规模也随之增长。通过各种方法收集的原始数据(即非结构化数据)的指数增长迫使公司必须改变其业务战略和运......
随着遥感影像数据量的增加,传统非监督分类迭代自组织分析(ISODATA)算法的运算将十分耗时,应用并行计算技术能够有效解决该性能瓶......
随着我国智能电网技术不断地发展和深化,电力信息系统面临着数据海量、分布异构、处理复杂、使用繁琐、维护困难等问题,而云计算技术......
学位
随着遥感技术的不断发展,遥感数据获取呈现三多(多平台、多传感器、多角度)和三高(高空间分辨率、高光谱分辨率和高时间分辨率)的......
学位
网络书写纹是指用户在网络文字中留下的具有独特写作风格(如用词习惯、语法结构等)的特征集合。网络书写纹就像人的指纹一样,是可......
利用MapReduce模型可自动编写串行程序及编程接口简单的优点,实现量子进化算法在MapReduce模型下的并行化,提出基于MapReduce模型......
社会化标签系统是Web2.0的一个重要应用,标签之间的共现关系抽取对于信息检索和标签推荐具有十分重要的意义.本文在分析社会化标签......
在超大规模数据集的分簇管理上,存在大数据获取、存储、检索、分析和可视化等困难。面对爆炸式增长的数据,利用分布式、并行计算原......
针对传统的并行哈希划分算法不能高效地利用多核处理器的并行资源,且不能较好处理有倾斜的输入数据的问题,提出了一种在多核处理器......
MapReduce已经发展成为大数据领域标准的并行计算模型.理想情况下,一个MapReduce系统应该使参与计算的所有节点高度负载均衡,并且......
在对PageRank算法进行研究的基础上,利用MapReduce编程模型思想对PageRank算法进行改进,设计了在云平台Hadoop环境下运行的基于MapRe......
互联网的发展,使人们逐渐进入了大数据时代,云计算也发展起来。本文首先简述了云计算和大数据的相关概念,然后具体介绍了Map Reduc......
期刊
分析电子商务欺诈信息的特点,用“成交时间至好评时间”“价格修改幅度”“申请退款占比”“有图评论占比”等检测指标来刻画“炒......
量子蚁群算法是在蚁群算法的基础上结合量子计算而提出的,该算法具有较好的全局寻优能力和种群多样性。应用MapReduce的key/value编......
针对石漠化演化模拟预测CA模型在单机上训练和运行时间较长的问题。给出了MapReduce编程模型实现的并行化石漠化CA模型,并在用普通P......
针对传统粗糙集属性约简算法无法高效处理日益增长的大数据问题,提出一种基于云计算的多层量子精英属性协同约简算法。该算法首先......
为高效处理社交网络产生的海量数据,并保证社交网的可扩展性,将TF-IDF(Term Frequency-InverseDocument Frequency)算法进行MapReduc......
针对线性时间选择算法随着元素数量的增加,执行效率较低的缺点,提出了MapReduce模型下的并行线性时间选择算法。重新设计了线性时间......