Turbopix算法的CUDA并行实现

来源 :微型机与应用 | 被引量 : 9次 | 上传用户:mdyd888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
过分割是计算机视觉领域流行的图像预处理方法。针对其运行速度慢的缺点,对广泛采用的Turbopix算法提出CUDA并行优化的方法。通过每个线程执行一个超像素扩张的任务分配,实现了水平集函数的并行演化;利用纹理存储空间和常数存储空间的优化策略,改善了数据访存的效率。实验结果表明,在GT 240M平台上,平均加速比达到了15以上。
其他文献
针对目前电能质量分析仪存在的不足,结合硬件与软件的优点,提出采用Linux+DSP的设计方案,不仅方便外围设备的扩展,也利于算法及应用程序的移植,可以根据实际的应用环境采用不同的算
针对IMT—Advanced协作多点传输试验床中对串行高速通信接1:2SRIO的应用需求,分析了背板间SRIO通信的FPGA设计关键点。仿真与实测结果表明,设计的SRIO接口可实现全双工可靠通信,
根据高速铁路路基的较高光辐射反射率,提出了一种基于数学形态学的图像二值化检测方法。计算机仿真证明,该方法能快速提取出高速铁路图像。
在编写优化算法软件时,用户输入的表达式通常是字符串类型,如何实现用户与计算机的交互,即怎样让计算机读懂用户输入的字符串类型的数学表达式,是计算机优化计算所要面临的首要问
为使无线点菜群体普及化,以微控制器STC89C52为核心控制数据的发送和接收、时间实时显示、语音提醒,系统采用无线通信芯片IA4421,上位机界面通过Visual Basic来实现。系统具有低
针对在研的视频数字化设备开发了一种视频流量监测系统。该系统采用微软MFC的API技术设计,通过通信接口接收流量信息,并经信号处理后实时显示视频设备的流量信息。应用结果表明,该监测系统运行稳定可靠,监测精度高,具有一定的实用性和推广价值。
针对当前语音网络传输系统中存在的环境噪声、回波、设备工作不稳定等问题,提出了一种新型的嵌入式语音网络传输系统设计方案。该系统以ARM9嵌入式处理器$3C2410为核心,ARMLinu
主要研究了基于 Linux 内核的网卡驱动的移植。 Linux 网络设备驱动程序的体系结构可以分为4层,首先分析了各层的具体功能实现,并在此基础上充分利用 S3C2440开发板完成 DM9000
将动态频谱接入技术引入到车辆通信网络中,提出了一种使用空闲广播电视信道进行车辆动态频谱接入的模型。该模型将用户通信需求分为紧急和普通服务请求,构建马尔科夫链分析其服
研究了机器视觉技术在三维物体识别定位问题中的应用。利用Visual C++编程软件建立了摄像机标定界面,实现对摄像机进行快速标定的功能。提出了一种SIFT特征和Hu不变矩融合算法,该算法是一种融合了局部特征和全局特征的算法。其中全局特征反映了对三维物体图像的整体信息进行粗略匹配和定位,局部特征可以在全局特征中进行更准确特征匹配,该算法对伸缩、旋转和平移等有很好的抵抗能力。实验结果表明,该视觉算法可