基于数据流范式的机器学习可视化编程系统研究与实现

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:jy02191348
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,计算机的硬件性能有了飞跃性的提升,随之而来的就是人工智能热潮。机器学习是人工智能的重要分支,它被广泛运用于各种领域,并取得了极佳的效果。各种基于文本编程的开发框架,有效地降低了专业人员进行机器学习建模的难度,但对于非专业编程人员而言,他们依然面临着搭建、优化模型需要复杂的背景知识,以及数据预处理、模型训练等关键步骤中繁琐的编程实现问题。因此研究一种能够降低机器学习建模门槛的工具具有十分重要的价值和意义。本文在对可视化编程技术和机器学习建模特点进行研究的基础上,设计并实现了一套基于数据流范式的机器学习可视化建模与编程工具。本文主要贡献如下:1)对编程过程进行抽象,并基于数据流范式,生成用于描述编程过程的数据流计算图。2)对数据流计算图进行形式化描述,通过分析机器学习建模基本步骤特点,对图中节点进行分类、定义其图元形式,并分析节点之间数据流动的特点,提出节点关系模型。3)设计适用于基于数据流范式的机器学习可视化编程的图文法MLG,并对其产生式进行描述,提出了MLSDA算法用于检测系统中程序语义正确性。4)设计代码生成算法,提出基于计算图增量的节点排序算法,降低排序的时间消耗,并配合定义的节点属性图重写规则,生成可执行代码。本文通过对机器学习建模过程中常见的问题进行分析,设计并实现了一个可随时随地在线访问的可视化编程系统。系统将建模过程中高度调优的计算模块或算法封装为可交互组件,通过组件交互完成编程,屏蔽了程序实现细节,支持自定义数据集、自定义交互组件、导出代码与应用,并可在线完成建模流程,与表示建模步骤的节点运行结果进行交互,从而使非专业人员可以高效地进行机器学习应用开发。
其他文献
地震预警是指在地震破坏性能量抵达预警区域前快速准确地报告地震信息,其中主要的科学问题是地震事件的判断(P波到时的捡测)、地震震源的定位和震级大小的估算。本研究即围绕这三个问题开展研究,提出基于深度机器学习方法的P波捡拾算法Ppick、震源定位方法DNNLOC和震级估算算法CNN-EQMG。快速准确的P波到时捡拾对地震预警系统至关重要。传统的P波到时捡拾算法包括长短时平均法STA/LTA、赤池信息准
近年来,随着科技的进步,机器学习技术得到了飞速发展,在工业制造,医学诊断,无人驾驶等许多领域,我们都可以看到机器学习的影子。经济科技的发展使得机器学习面对的应用场景不断扩大,同时这也使得数据形式变得复杂:例如数据中含有较多噪声或者一些错误的内容,这给传统机器学习技术的应用带来了巨大的挑战。在众多机器学习技术中,Takagi-Sugeno-Kang(TSK)模糊系统作为一种常用的分类模型,凭借其优秀
数据同化是指在考虑数据时空分布以及观测场和背景场误差的基础上,在数值模型的动态运行过程中融合新的观测数据的方法。它可以有效解决随机动力系统的状态及参数估计问题,应用领域包括大气科学、海洋科学、水文、自然灾害、全球定位系统、机器人和计算机视觉等。机器学习尤其是深度学习可以从数据中学习复杂的模式和非线性关系,根据已知数据给出预测或估计。目前已经在模式识别与图像处理、控制及优化、通信、自动驾驶和机器人仿
随着国家提倡智能制造,越来越多的机器人等辅助分拣工具被用到分拣上面。但是大部分用到的机器人还是需要人工示教,并不能充分提高分拣效率和机器人的灵活性。将带有机器视觉的机械手技术,使用在物流分拣任务中会大大提高分检效率。如何让机械手移动到视觉系统识别出物体的位置,并准确抓取是本文主要解决的问题。对于上述问题,本文以VS2019作为开发平台,用LS3-B401S-V1爱普生机械手作设计了一套面向物流行业
智能工厂是智能制造的重要内容,而生产系统性能预测和评估是智能工厂生产控制和决策优化的基础。智能工厂利用传感器、物联网等技术实现物物互联、信息共享、服务协同等功能,其中利用采集的海量多源制造数据,挖掘出制造系统性能指标的演化趋势及数据间的影响规律,实现车间性能预测,有利于指导智能车间的运行优化和自主调控。因此,本文在智能工厂背景下研究基于数据驱动的生产系统性能预测,主要研究内容如下:(1)数据驱动的
现如今工业机械设备朝着精密化、自动化、大型化和系统化的方向发展,滚动轴承的微小故障就可能对大型精密机械设备造成重大损害。机械零部件故障的诊断与预测一直都是保障工业机械设备稳定运行的基本条件。滚动轴承作为机械设备中不容忽视的存在,其稳定运转更是保障机械设备安全运作的前提。鉴于滚动轴承在工业设备中的重要地位,轴承故障诊断算法应运而生。而传统轴承故障诊断算法对专家知识要求高,设计的诊断模型结构复杂,并且
疲劳状态下的驾驶(疲劳驾驶)是引起交通事故的主要原因之一,给人们的生命和财产造成了重大损失。因此,设计并实现一种能够对疲劳驾驶准确地做出预警的方法,对减少因疲劳驾驶导致的生命和财产损失有重大意义。脑电图(Electroencephalography,EEG)记录了人大脑皮层神经细胞的电活动,可以直接反映大脑的即时状态,避免人为主观因素的影响,所以被认为是最有效的精神状态检测方法。传统的基于EEG的
在如今的大数据时代,购物类、服装类以及生活服务类等电商推荐系统层出不穷,系统的搜索以及推荐能力成为支撑该系统的核心技术,如何推荐给用户最满意的门店、商品也是系统的主要功能之一。然而通过研究发现:一些电商平台仍使用数据库关键词模糊查询的方式,导致搜索准确率低下;推荐系统中数据库压力日益增加导致数据提取速度降低;基于传统机器学习的推荐方式逐渐无法满足千人千面的推荐。针对上述问题,本文从数据库、搜索性能
单井分层结果是制定油田开发方案的重要依据。由于地质构造复杂、软硬件技术受限、数据处理方式不当等原因,初始单井分层数据可能存在误差甚至错误,因此,越来越多的科研人员开始研究分层数据的质检方法,目的是保证分层数据的准确性。目前油田分层数据质检的主要方法是现场专家根据先验知识,选择合适的测井曲线对井重新分层,进而通过对比前后分层结果进行校验。经过对某油田数据中心调研发现,在当前分层数据质检过程中,存在分
随着数据规模不断扩大,将深度学习模型应用在大规模图数据上,有效地提升了连边预测的精度,在推荐系统、社交网络等诸多领域具备较强的应用价值与潜力。近年来,虽然已有学者在同构图上开展对抗攻击研究,但针对异构图的安全性研究仍处于初步探索阶段。本文针对应用面较广的异构图推荐系统展开安全性探究。同时,进一步将研究拓展到一般性的多重异构图嵌入模型攻击问题中,探索了灰盒条件下的投毒攻击策略,验证了异构图深度学习模