【摘 要】
:
随着工业4.0的到来,互联网与工业结合愈发紧密,但工业大数据规模大、类型杂、质量低的特点导致大量设备数据无效且企业人员无法正确监测到设备信息.针对这一问题,提出一种基于Flink的工业大数据平台.以企业传感器数据为基础,用Flink将不同类型的数据发送至消息管道Kafka中暂存数据,用Flink对Kafka中的数据进行处理,实现工业大数据的查询与预警,与当前典型的两个大数据平台进行比较.实验结果表明,由Flink和Kafka集成的工业大数据平台,能更清晰高效地查询到设备数据且能够更快速地实现对企业设备的预
【机 构】
:
河海大学计算机与信息学院,江苏南京211100;南京广厦软件有限公司工业大数据开发部,江苏南京210000
论文部分内容阅读
随着工业4.0的到来,互联网与工业结合愈发紧密,但工业大数据规模大、类型杂、质量低的特点导致大量设备数据无效且企业人员无法正确监测到设备信息.针对这一问题,提出一种基于Flink的工业大数据平台.以企业传感器数据为基础,用Flink将不同类型的数据发送至消息管道Kafka中暂存数据,用Flink对Kafka中的数据进行处理,实现工业大数据的查询与预警,与当前典型的两个大数据平台进行比较.实验结果表明,由Flink和Kafka集成的工业大数据平台,能更清晰高效地查询到设备数据且能够更快速地实现对企业设备的预警.
其他文献
为加速嵌入式平台ARM CMSIS-NN上的神经网络卷积算法,提出一种面向开源RISC-V(精简指令级架构第五代)的卷积算法.采用RISC-V的P拓展指令集中特有的8位数据操作指令,优化ARM CMSIS-NN(微处理器软件接口标准)库中因为缺少DSP指令8位数据操作指令而带来的内存使用效率不高的不足.经实验仿真和下板验证,在蜂鸟E203 FPGA开发板上以16 MHz的时钟频率完成功能验证,与同等实验室实验情况下的arm-cortex-m3等设备相比,性能提升约12倍.
为提升基于TextRank算法的关键词抽取效果,分析中文语义结构和分词算法的特点,提出一种融合语义依存和外部知识库的方法.使用语义依存图代替共现窗口构建词图,增强词图中各节点间的语义联系;在此基础上引入规范化谷歌距离和领域词典这两个外部知识库特征,结合文档内外部信息对词图中的边进行加权计算,对提取出的文档关键词应用前后向匹配算法做进一步处理,使提取的关键词更具语义完整性.实验结果表明,该方法在数据集上的关键词抽取效果有了显著提升,可读性更强,验证了所提方法的有效性.
针对原始SSD算法各检测特征层没有关联导致特征融合较差,使得检测效果不佳,而现有改进算法DSSD以及RSSD等检测速度太慢的问题,提出一种基于多任务分支的SSD目标检测算法.对特征金字塔进行研究,构建语义与定位级联模块和融合分裂模块用于两个不同分支,在通过两个分支模块之后得到两组多尺度特征,构建多尺度通道聚合模块进行融合和加权,得到最终用于检测的特征金字塔.实验结果表明,在PASCAL VOC 2007数据集上达到79.6% 的检测精度,与SSD、DSSD相比具有更好的准确率,检测速度优于DSSD,具有实
针对目前的领域概念查询聚类方法中未见考虑用户偏好,提出一种支持用户偏好查询的领域概念图模型.该图模型主要包括两部分:基于概念本身考虑,利用综合语义相似度计算方法构建概念的语义关系图;基于用户查询偏好考虑,采用改进的互信息计算用户生成数据间隐含的查询偏好,将其结果用于补全领域概念的语义关系图.这一处理过程使得原有领域概念的语义关系图得到了有益的补充,满足了用户的偏好查询.经实验验证,该算法较现有方法,查准率、查全率以及F-measure值均有所提高且响应时间得到了降低.
为解决现有深度学习图像分割算法不能有效分割指针仪表图像中密集小目标的问题,提出基于多重感受野UNet的仪表图像分割方法.将自编码器结构和空洞卷积结构结合,使多尺度浅层特征和深层语义信息融合;以多种光照强度下采集的指针仪表数据训练模型,充分提升神经网络的泛化能力;并行调节空洞卷积参数,使神经网络学习到最优模型.实验结果表明,算法显著提升了指针仪表图像中密集小目标的分割效果,有效泛化于不同光照强度下采集的同种指针仪表图像,验证了该模型的有效性.
针对高效视频编码(high efficiency video coding,HEVC)分像素运动估计亮度分量插值算法计算量大、冗余度高、难以实现不同编码块之间灵活切换的问题,提出一种动态可重构且具有高数据复用率的分像素插值算法实现方法.根据编码单元(coding unit,CU)的规模和大小自适应地对其周围参考像素块进行插值计算,得到最优预测单元的编码模式和运动矢量.实验结果表明,与专用硬件实现的分像素插值算法相比,不同编码块灵活切换的同时,参考像素的读取数量减少43.8%,硬件资源消耗减少18.5%.
针对城市停车难,车位检测环境复杂等情况,研究了一种基于Inception-V4算法的车位状态检测方法.在Inception-V4网络结构基础上使用Leaky_ReLU代替ReLU作为激活函数,解决ReLU激活函数引起的神经元失活问题;在网络分类层前添加FReLU激活函数层和多个全连接层,使其获得有更丰富语义信息的特征向量,防止了网络过拟合问题,提高车位状态检测模型的整体性能.基于PKLot停车场数据集的实验结果表明,该方法对车位状态检测准确率较原模型有较大程度的提升.
为提高智能车辆的行人检测成功率,同时保证人身安全,提出一套完整的仿行人步态装置研发流程,通过建模仿真的方法促进该装置的研发并降低成本.仿真模型按照人体真实数据进行设计,步态的变化主要体现在四肢上;利用D-H参数法和正逆运动学知识,结合MATLAB建模和关节轨迹规划的方法,实现运动仿真;成功模拟出行人步态,得出仿真模型的末端轨迹、关节转角等步态指标在一个周期内的变化.将仿真结果与标准人类行走周期图谱进行了对比验证,保证了仿真模型的结构设计以及运动学模型的合理性,为后续的实际开发提供一定理论依据.
对基于深度学习的红外图像步态识别方法进行研究,利用卷积神经网络相关技术搭建一个深度学习模型,以此对红外图像中人体步态轮廓特征进行学习,对红外图像中人体步态身份做出识别.使用图像形态学中的闭运算对图片进行数据预处理,实验结果表明,经过预处理后的红外图像能够有效减少因红外相机成像原理导致的图像中产生冗余信息,有效提高模型的泛化能力.经过对实验数据的对比与分析,该模型及数据预处理的方法对红外图像中的人体步态识别有着比较显著的效果.
为有效解决药物靶点亲和力预测中单模型提取特征种类受限问题,结合深度学习混合模型,提出一种深度并行全局特征提取策略.利用卷积神经网络(CNN)和特征存储融合层构建局部特征提取器,实现药物靶点序列局部特征的多层次提取、存储与压缩;利用卷积神经网络(CNN)和双向长短时记忆(BiLSTM)神经网络的串行混合模型构建上下文特征提取器,提取局部特征之间的上下文联系;将两种互补特征进行融合.该特征提取策略解决了单模型提取特征种类受限问题,缓解了数据集差异对特征提取效率的影响.实验结果表明,该特征提取策略有助于提升预测