自动向量化:近期进展与展望

来源 :通信学报 | 被引量 : 0次 | 上传用户:hwqcy1021
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着单指令流多数据流(SIMD)技术的迅速发展,近年来许多面向SIMD扩展部件的自动向量化编译方法被提出,有效缓解了程序员手写向量程序的压力,并发挥了SIMD扩展部件的加速效能.基于此,分析总结了自动向量化领域近10年的研究成果,从保义分析和变换、向量化分组分析和变换、面向处理器支持特性的分析和变换以及性能评估分析这4个方面分类归纳了自动向量化的关键问题和主要突破,进而对4个方面的发展趋势和研究方向进行了展望.
其他文献
针对划分聚类算法处理海量的数据存在的数据离散系数较大与抗干扰性差、局部簇簇数难以确定、局部簇质心随机性及局部簇并行化合并效率低等问题,提出了一种基于Spark框架和粒子群优化自适应策略(ASPSO)的并行划分聚类(PDC-SFASPSO)算法.首先,提出了基于皮尔逊相关系数和方差的网格划分策略获取数据离散系数较小的网格单元并进行离群点过滤,解决了数据离散系数较大与抗干扰性差的问题;其次,提出了基于势函数与高斯函数的网格划分策略,获取局部聚类的簇数,解决了局部簇簇数难以确定的问题;再次,提出了ASPSO获取
针对不同的异常检测方法的差异及应用于工业物联网(IIoT)安全防护的适用性问题,从技术原理出发,调研分析2000—2021年发表的关于网络异常检测的论文,总结了工业物联网面临的安全威胁,归纳了9种网络异常检测方法及其特点,通过纵向对比梳理了不同方法的优缺点和适用工业物联网场景.另外,对常用数据集做了统计分析和对比,并从4个方向对未来发展趋势进行展望.分析结果可以指导按应用场景选择适配方法,发现待解决关键问题并为后续研究指明方向.
对结构化电子健康档案中行的概率分布进行建模并生成仿真数据非常困难,因为表格数据通常包含定类列,传统编码方式可能产生特征维数灾难的问题,从而使建模异常困难.针对这一问题,提出利用庞加莱球模型建模医疗分类特征的层级结构,并采用高斯耦合的生成对抗网络技术合成结构化的电子健康档案.实验表明,该方法生成的训练数据能够在保证隐私性的前提下,实现与原始数据仅相差2%的可用性差异.
为满足智能信号处理和物理层安全需求,针对频谱资源紧缺问题,提出了一种智能超表面辅助设备到设备(D2D)通信的资源分配算法.D2D用户通过复用蜂窝用户频谱资源实现通信,考虑D2D传输速率、基站发射功率和RIS发射相移约束,构建了用户保密速率最大化问题.为了解决该非线性规划问题,提出了一种并行卷积神经网络算法,以得到最佳资源分配方案.仿真结果表明,所提算法能够有效提高系统保密速率,且明显优于其他基准算法.
针对盘式永磁电机气隙磁密和反电动势中含有谐波、存在转矩脉动的问题,提出了一种磁极形状优化方法以降低盘式永磁电机气隙磁密波形和反电动势波形的畸变率、抑制转矩脉动.建立了盘式永磁电机的等效磁网络模型,基于此模型解析计算出电机的空载反电动势,并通过有限元法进行了仿真验证.在确定最小气隙长度前提下,对不同磁极整形方法(即不整形、圆弧削极、偏心圆弧削极)气隙磁密、反电势、转矩脉动这些电磁性能进行了比较,得出了最佳优化方案.结果表明,优化设计后,气隙磁密波形和反电动势波形的畸变率明显减小,转矩脉动得到抑制.
为提高电机气隙磁密的正弦度以提升电机的性能,将Halbach阵列应用于直驱式外转子永磁同步风力发电机.设计了一台1.2 MW直驱式永磁同步风力发电机,通过有限元法对比分析了不同Halbach充磁阵列和传统径向充磁阵列电机的气隙磁密及感应电势波形,仿真结果显示45度Halbach永磁阵列永磁电机的气隙磁密波形和感应电势波形的正弦度最高且谐波含量最低,发电效果最佳.针对45度Halbach阵列永磁同步风力发电机进行了温度场仿真,结果表明,电机不存在局部过热情况,设计的Halbach阵列永磁同步风力发电机能够稳
为解决现有超高频射频识别定位方法受室内环境干扰导致定位精度不高的问题,提出了一种基于跳频辅助的RFID载波相位室内扩展卡尔曼滤波(EKF)定位算法.利用跳频获取的虚拟大带宽进行距离粗估计以实现多径抑制,并通过多径抑制后的相位完成可靠双频点选择以及参数优化,最终采用EKF算法实现高精度快速定位.实验结果表明,所提算法平均定位误差为9.35 cm,定位解算实时性比传统的基于中国剩余定理(CRT)的解整周方法提高了近10倍.
针对当前动态异构冗余系统中异构体调度缺乏动态性和仅考虑二阶异构性,导致系统易被攻击者找到共模漏洞从而攻破系统的问题,提出了一种同时考虑执行体高阶异构度和历史信息的异构执行体动态调度算法——基于高阶异构度的负反馈调度算法.该算法首先计算等待池中执行体的高阶异构度矩阵,然后在每次调度执行体时同时考虑历史威胁和异构体间的高阶异构度来确定调度执行体集.实验表明,结合高阶异构度和历史信息的策略使算法获得了动态性和安全性的平衡,且防御能力较先前算法更优秀.
为降低异构蜂窝网络的基站能耗和同频干扰,联合能量收集与能量协作提出一种以能量效率优化为目标的联合优化算法.首先,考虑用户服务质量约束、蜂窝基站功率约束以及可再生能源收集约束,构建联合资源分配的混合整数非线性规划问题.其次,考虑到该问题是一个NP-难问题,难以直接求解,结合固定变量法将复杂原问题分解成单独求解用户关联、功率分配、能量协作3个子问题,分别利用拉格朗日对偶法、粒子群优化算法和匹配理论求解这3个子问题.最后,通过收敛迭代算法,联合以上3种算法求得原问题的最终解.仿真结果表明,所提算法相较于对比算法
为了充分利用评分的有效信息,并进一步研究评论的重要性,提出了一种融合评论文本特征和评分图卷积表示的推荐模型,利用图卷积编码学习用户和商品在评分上的特征表示,结合文本卷积特征,使用注意力机制来区分评论的重要性,然后通过隐因子模型把在评论和评分上学习到的特征表示融合产生推荐.在亚马逊公开数据集上的实验结果表明,提出的模型显著优于现有的模型,证明了提出的模型的有效性.