基于R的并行统计计算

来源 :2012全国高性能计算学术年会 | 被引量 : 0次 | 上传用户:waq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  随着统计分析中数据规模和复杂性不断的增加,高性能计算也开始在金融、经济和管理等统计计算主导的领域中发挥重要的作用。本文将对基于R的统计分析中并行计算技术的发展现状和最新进展做一个综述,重点从用户的角度考察R在不同体系结构计算平台上并行统计计算的实现。一个人造和真实应用的测试给出了应用效果。
其他文献
学科研究热点对科研工作者具有重要的指导作用。常规的学科研究热点检测方法面临检测成本高、检测信息相对滞后等问题。为此本文提出一种基于学术会议征文的学科研究热点检测方法,并借助CNKI学术趋势对其进行评估。实验结果表明该方法是有效可行的。
开发了一个高效率和易扩展的基于GPU(图形处理单元,Graphic Processing Unit)的并行分子动力学模拟程序.程序能够在GPU 上处理固相共价晶体中原子间的多体相互作用.通过测试,开发的代码在Mole-8.5 和天河-1A 上都取得了良好的并行效率和优秀的浮点操作性能.可以预计,晶体硅的大规模分子动力学模拟在计算其宏观性质、表界面现象和反应沉积方面具有巨大的应用潜力.
借鉴无损压缩编码中的GAP和GED预测器模板,改进该模版并应用在图像边缘检测中,提出一种新颖的基于多方向梯度边缘预测器(MGEDP)模板的动态阈值控制的边缘检测算法。以图像中心划分四个区域,采用并行技术同时多个方向应用MGEDP预测器模板,分别预测错误值;利用错误反馈信息构建预测误差图像;然后利用大津算法(OTSU)计算阈值;分类误差图像边缘;细化边缘,最后合成边缘图像。实验证明,该算法应用并行技
本文提出一种并行编程语言CC$,尝试解决分布式众核并行计算机的编程困难.CC$的编程模型以Multi-BSP模型为基础,将分布式众核并行计算机的硬件架构抽象为三层.数据按照存储的层次和共享范围分为五类,以便在不同层次上提供共享.CC$还提出一类虚拟指令解决不同层次之间的数据交换,实现数据访问的逻辑化描述.并行程序按照三层Multi-BSP超步嵌套执行.测试表明,CC$程序的运行效率高,易学易用,大
多尺度现象及相关理论方法是复杂物质系统研究中重要的科学问题。传统的量子力学或分子动力学方法都难于处理多尺度体系中存在的现象。第一原理离散变分线性标度(DVM-DAC)算法是一种有效的大尺度体系计算方法。它采用分而治之的方案,获得了O(n)的计算复杂度。但由于计算规模及材料复杂性等因素,在实际研究中依然存在相当的计算瓶颈,难以满足大尺度物性研究的需要。发展了一种基于DVM-DAC的混合粒度并行算法并
分布式文件系统伴随着云计算的发展逐渐受到重视.parallel-NFS做为主流的分布式文件系统,吸引了大量国内外研究人员的兴趣.本文描述了parallel-NFS的系统框架和工作原理,提出了parallel-NFS不能满足动态增减存储节点问题,分析了产生问题的原因,进而提出了一种parallel-NFS存储节点动态伸缩的方案,该方案已经在国家超级计算天津中心的超级计算机集群系统中得到了验证.
传统虚拟机调度算法未充分考虑并行任务的执行效率问题,当多个虚拟机联合执行并行计算任务时,虚拟机管理器仍采用时分复用方式分配物理CPU(PCPU),导致并行任务串行化,效率大大降低.现代多核处理器平台具备多个可用的计算核心,满足多个虚拟机并发执行的需要,本文针对多核平台下的并行虚拟机调度问题,提出了一种基于任务特征的虚拟机调度算法CON-Credit.该算法的核心思想是在调度并行任务(如MapRed
本文介绍了一种基于光纤传输的冲击波超压存储测试系统,该测试系统解决了在爆轰环境下进行远距离安全性操作,大大提高了信号传输的抗干扰能力和信息的保密性,有效地提高了数据传输效率。该系统主要由自由场压电式压力传感器、光纤传输模块(含电池模块)、高度集成的数字式采集存储设备、计算机控制和数据分析系统等模块电路组成。本文介绍了基于光纤传输的冲击波超压存储测试系统应用在密闭防护罐体内安放1Kg当量TNT炸药进
移动互联网和云计算的不断发展和壮大,使得新型网络化应用成为信息技术的热点。为了适应这种发展趋势,需要将当前大量的传统应用进行移植和迁移。面对传统应用,本文针对Linux系统下的GTK+应用程序提出了一种运行支撑环境的设计方案。通过该方案,实现了服务器端的GTK+应用资源显示在客户端浏览器中和多用户能够同时在客户端浏览器中运行服务器端的GTK+应用。
近来,近似重复图像检测已经成为了研究的热点,本文提出了基于bag-of-words和哈希编码的近似重复图像检测方法。首先利用bag-of-words把一副图像表示成一个500维的特征向量,然后利用主成分分析进行特征降维,并利用hash编码技术对特征进行编码,最后利用动态距离度量技术实现近似重复图像的检测。实验结果表明,该检测方法的查准率可以达到90%-95%,查全率为70%-80%,利用该方法进行