面向龙芯处理器SIMD扩展的编译器内在函数优化

来源 :2011年全国高性能计算学术年会(HPC china2011) | 被引量 : 0次 | 上传用户:augsep
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  通用微处理器中的单指令多数据(SIMD)指令扩展因能有效提升并行处理能力而一直受到处理器生产厂商的亲睐,龙芯处理器也增加了这种SIMD扩展。如何为程序员提供高效、好用的SIMD编程接口,是工业界和学界研究的热点问题。我们在龙芯编译器中实现了针对该扩展的内在函数支持,为程序员提供灵活、方便的SIMD编程接口。为了提升接口支持的效率,我们利用龙芯编译器和龙芯处理器的特性进行编译优化。并利用有龙芯SIMD指令嵌入式汇编优化的Mplayer视频解码器作为基准,将其采用一一对应的方式改写为内在函数实现,性能测试结果显示内在函数实现的解码器性能比嵌入式汇编形式还要好2%。实验证明,我们在龙芯编译器中实现的内在函数支持,在方便程序员编程的同时,也能利用编译器已有的编译优化。
其他文献
秦红红,安徽工业大学附属中学英语学科高级教师;中国民主同盟盟员。凡是观摩过省教坛新星、市学科带头人、全国外语教师名师和教学能手秦红红教学的老师,都评价她的课教得灵
他总是笑眯眯的,笑得敦厚、诚恳。在小区里漫步,他跟人友善地打着招呼,唠家常,跟邻家老大爷没两样。    他的刻苦也为人称道。他曾经每天凌晨4点起床,论文、规划、著述、画作、书法,都是在清晨时完成的。“夙兴夜寐,时断时续,苦不自拔。”但是他乐之,好之。工作告一段落后,合上眼眯一会儿,带上夫人备好的午餐准时上班;中午不回家,在办公室的微波炉里一热,凑合完事,继续忙手边的活儿。    他把工作看作是幸福
  本文提出了一种可应用于高性能计算领域的基于剖视信息的编译指导的动态电压调节方法。该方法它通过对插桩数据的分析,发现可以降频运行且对程序性能影响很小的程序区域,通
  寄存器作为机器硬件结构中有限的宝贵资源,使得寄存器分配技术成为编译器最为关键的优化技术之一。寄存器分配效率提高的关键在于如何最大限度的减少溢出带来的开销,针对这
近年来我国社会经济不断的向前发展,这也让我国民众的生活物质水平得到了极大的提升.在这样的背景下,人们对于商品的质量要求也是越来越高.因此,作为保障商品质量的计量检测
会计内部控制作为企业管理体系中的重要内容,内部控制效果在一定程度上会影响到企业的经营效益与经济水平,对于企业会计的运行效果也造成了比较大的影响,还会导致一些财务管
2011年4月5日,河仁基金会在北京正式成立,曹德旺捐赠3亿股福耀玻璃股份作为基金会运营资本。去年4月初,曹德是减持福耀玻璃八千多万股,套现10亿元,用作慈善事业。今年4月曹德
随着我国建筑行业的不断发展,高层建筑越来越多,导致地下结构的深度也越来越深,因此,对基坑施工的要求也越来越高,深基坑支护施工非常重要.在深基坑支护施工过程中,由于基坑
一直以来,企业财务会计就是主要负责会计核算和监督工作,而很少参与在企业的经营和决策中,存在感极弱,这两大工作内容的分离使得企业的财务管理工作和经营决策相脱离.本文将
  现代超标量RISC处理器大多具有多条可并发执行的指令流水线,现在流行的多核处理器更是将SIMD(Single-Instruction Muti-Data)作为一种提高性能的通用扩展。SIMD扩展流水线独
会议