用于射线跟踪的KD-Tree并行构建算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:xsnxj111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对实时射线追踪的要求越来越高,研究者们持续提出更高效的加速算法,设备厂商也在对硬件迭代升级。射线追踪算法本身具有天然的并行性,十分适合使用GPU进行并行加速。最初,射线追踪主要用于图像渲染,如今射线追踪被应用于电磁散射的仿真、声场仿真等各个领域。而KD-Tree是一种广泛用于射线追踪的加速结构,相对于其他结构,其对射线追踪有着较好的加速效果,但是其构建时间却较长,这一定程度上限制了 KD-Tree的应用。现有对KD-Tree的研究,大多只针对SAH算法部分进行加速,并不是全程用GPU加速。本文基于对前人构建KD-Tree算法的研究,提出了使用GPU进行全程加速计算的并行建树方案,使得KD-Tree的构建速度进一步提高。本文的主要创新点如下:一、提出了一种在GPU端进行面元指派的方法。针对现行建树方案将面元指派工作放到CPU端完成的情况,本文引入了并行求前缀和的思想,提出了一种在GPU端进行面元指派的并行方法,有效的减少了内存指派的时间,同时减少了 CPU与GPU之间传输的数据量。使用benchmark模型进行测试时,相对于在CPU端指派面元,在GPU端指派面元到子节点的总时间减少了50%以上。二、针对建树过程中重叠三角面元导致的内存增长问题,本文提出了一种预申请内存大小估计的方法。根据初始三角面元的数量预估最终三角面元数组长度,可保证在程序开始就申请到足够的内存空间。为合理利用申请的内存空间,提出了一种按子节点三角面元数量比例动态分配内存的方法,实现了对预申请内存的无冲突访问。引入了一种计算SAH值的优化算法,并结合归约算法,加速了最小SAH值的计算过程。在本文实验环境中,相比于串行算法,该方法计算最小SAH值的加速比达到了5.8 倍。三、在以上工作的基础上,针对递归建树造成CPU与GPU间频繁数据传输的问题,提出了一种基于广度优先构建KD-Tree的方法,该方法使用两个队列分别存储偶数层与奇数层的待剖分节点,并逐层进行建树,每层只往CPU端传输下一层每个待剖分节点内面元的数量。所有建树任务都在GPU上完成,CPU仅需要计算开启的线程数,显著减少了 CPU与GPU的数据交互频次,降低了由此带来的时间开销。实验结果表明:在不降低KD-Tree质量的情况下,本文所提出的GPU并行算法,在常见场景中有较快的建树速度。使用本文方法构建KD-Tree,相比传统串行算法,加速比可以达到4.1~7.9倍;相比基于空间树的构建方法,有1.2~1.3倍的加速比。
其他文献
肉牛的反刍行为是其生理特点的一大标志,可以直接的反映当前肉牛的健康情况。而反刍行为作为舍饲肉牛的主要日常行为方式,除体现健康情况外,还可呈现出肉牛的饲料营养配比、病愈程度、最佳出栏时间等信息。因此,本文设计了舍饲肉牛反刍行为监测系统,用于采集肉牛反刍行为的相关信息;应用BP神经网络及支持向量机的方法实现了肉牛反刍行为识别,进而研究肉牛的反刍行为规律。本文研究主要内容如下:(1)首先对肉牛的日常行为
随着阿里巴巴旗下支付宝中的余额宝以及腾讯旗下微信中的理财通的推出,使得人们把大量的资金投入到余额宝或理财通中购买货币基金。因为货币基金的高安全性、高流动性、稳定收益性等优势,吸引了越来越多的用户将手中的资金投入到购买货币基金中,以此来达到增长收益的目的。由于余额宝和理财通基于两大知名的应用平台:支付宝和微信,使得前期大部分的用户被他们两家所吸引。而作为传统的资金储蓄机构-银行,反而在这次的货币基金
目的了解罕见病DeS anto-Shinawi综合征(DESSH)的发病机制、临床特点及癫痫发作的特点,提高诊疗经验。方法对1例DESSH导致癫痫的患者的诊疗经过进行回顾性总结。结果本例患者
柱形壳结构在工业领域应用广泛,在海工装备领域,柱形壳常作为海上平台的桩腿并且主要承受轴向压力。本文通过研究具有端部缺陷和厚度缺陷的中等高度304不锈钢柱形壳在轴向压力下的失稳破坏行为,对以后研究和设计轴向压力下的端部和厚度缺陷柱形壳具有指导性作用。首先,对柱形壳的非线性和线性屈曲进行理论研究,在非线性屈曲理论开始前介绍对非线性计算的现代方法进行介绍。在线性和非线性理论公式推导之后,介绍国际上对柱形
百菌清是农业上常用的杀菌剂,对多种水生生物有毒害作用。本研究旨在寻找一类无毒高效、来源丰富且能促进水中百菌清光降解的天然化合物,研究了6种黄酮类化合物对百菌清在太阳光和高压汞灯下的光解作用。通过高效液相色谱法对百菌清光降解产物进行定性定量分析,通过EPR自旋捕获技术检测光解反应体系中的活性氧化物种类,对6种黄酮类化合物促进百菌清光解的特性进行了分析。实验主要结果总结如下:1.在太阳光和高压汞灯下,
随着互联网的快速发展,Twitter和微博等社交网络已经成为人们获取最新信息的主要途径。社会热点话题很多时候都是通过微博平台产生,并引起广泛关注,而社会热点信息不仅对个人发展、公司经营产生影响,而且对社会舆论的实时监控和国家舆论引导也至关重要。因此对微博平台热点话题发现的研究具有重要的现实意义。微博信息最大的特点就是内容简短、随意性大,因此单一的模型(如VSM模型、LDA模型等)在建模时对文本信息
淀粉资源丰富,是一类制备生物质胶黏剂的理想原料,但是原淀粉或单一变性淀粉胶黏剂存在低固高黏、易凝胶老化等缺陷,而且储存稳定性、耐水性、粘接强度等较差,影响其广泛应用
随着经济全球化和社会分工的持续深化,制造业和服务业的边界业逐渐模糊,制造业服务化的现象最早由发达国家的企业发起,逐渐开始在全球范围内形成趋势。我国政府对此也给予了高度的重视,并将其视为实现我国制造业结构化升级的重要环节。自2014年始,我国政府陆续出台了《关于加快发展生产性服务业促进产业结构调整升级的指导意见》、《中国制造2025》、《发展服务型制造专项行动指南》等一系列政策文件来指导和支持制造企
近年来眼科疾病患者数量不断增加,然而专业医生的稀缺以及偏远地区资源匮乏使得许多眼科疾病患者无法得到及时的诊断,错过最佳治疗时间。如何自动化分析与诊断眼科疾病成为亟待解决的问题。研究眼科疾病的两个重要方向是眼底图像血管分割以及眼科疾病分级诊断。因此本文研究并提出两种眼底血管结构自动分割算法以及基于多任务学习的白内障糖网病联合自动分级诊断算法。眼底图像中血管结构能够很大程度上反映诸如白内障、糖网病等眼
密封继电器作为航天领域中重要的基础性元器件,其是否能稳定工作,关系到整个航天系统工作的可靠性。微粒碰撞噪声检测法是我国目前主要采用的航天电子元器件多余物检测方法。本文针对传统检测方法对组件信号识别准确率不高的问题,对密封继电器组件信号的检测运用了机器学习方法,采用神经网络模型并结合多个特征对多余物信号和组件信号进行分类识别,同时对神经网络的超参数寻优,找到最优的超参数组合构建模型。通过实验证明该方