面向工业生产的中文Text-to-SQL模型

来源 :计算机应用 | 被引量 : 0次 | 上传用户:bjbysj44
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
英文自然语言查询转SQL(Structured Query Language)语句(Text-to-SQL)任务的模型迁移到中文工业Text-to-SQL任务时,由于工业数据集的可解释差且比较分散,会出现数据库的表名列名等信息与问句中关键信息的表示形式不一致以及问句中的列名隐含在语义中等问题导致模型精确匹配率变低。针对迁移过程中出现的问题提出了对应的解决方法并构建修改后的模型。首先,在数据使用过程中融入工厂元数据信息解决表示形式不一致以及列名隐含在语义中的问题;然后,根据中文语言表达方式的特性,使用
其他文献
针对传统产品设计优化耗时耗力、效率较低等问题, 提出一种数据驱动的产品优化设计方法. 基于Scrapy爬取电商平台用户评论数据; 针对文本数据的特点, 利用K-means算法进行用户需求分析, 根据聚类结果得到优化目标; 对优化目标进行特征编码, 基于非劣排序遗传算法(NSGA-Ⅱ)进行产品特征优化迭代, 得到最终优化结果. 以某品牌电饭煲为实例进行应用, 以用户满意度为评估指标, 将电饭煲造型优
期刊
基于不可压光滑粒子流体动力学(Incompressible Smoothed Particle Hydrodynamics, ISPH)和全拉格朗日光滑粒子流体动力学(TLSPH)基本理论,提出了一种求解充液多柔体动力学数值模拟方法.与传统SPH方法相比,该方法可采用较大的时间步长、可避免压力振荡与柔性部件拉伸不稳定问题.通过求解混合压力泊松方程和引入位移修正技术可得到光滑的液体压力分布结果,通过
期刊
活态遗产地演变发展是连续性空间生产过程,揭示其特征与逻辑对于活态遗产地的保护、利用与传承具有重要意义。将表达遗产地活态性的3个要素——传统、地点、生活与“空间三元辩证法”相耦合构建TSL(Tradition-Site-Living)模型,并以丽江古城为例,探讨活态遗产地持续变化的一般规律。结果发现:1)古城经历了三个阶段的空间生产,即政治功能主导下的“空间中的消费”,工商功能主导下的“空间中的生产
期刊
恶性肿瘤是严重威胁人类生命健康的一种疾病.如何有效杀死肿瘤细胞,延长患者生存时间,是全世界一直试图攻克的难题.细胞死亡通常分为由基因调控的程序性死亡,包括凋亡、焦亡、自噬性死亡、铁死亡和坏死性凋亡,以及由外部刺激引起的非程序性死亡,即坏死.长链非编码RNAs(long noncoding RNAs, lncRNAs)作为人类基因组的主要组成部分,在调控肿瘤细胞死亡进程中发挥重要的作用.本文概述了l
期刊
现有不少模型着眼于对有限数据通过生成显式特征交互以进行挖掘来提升点击率预测效果,但存在以下问题:对于原特征与新生成的显式特征,直接一起输入到一个统一的神经网络结构进行挖掘然后输出,由于两者参数量差别较大导致在表征上差异巨大;同时如果直接采用多级层数的神经网络结构还会导致低层如第一层第二层信息的丢失,但若直接将各层进行累加以结合,则一些层中有用性有限的信息可能成为噪声以影响预测。为此设计多层权重结合
期刊
本研究利用现代人口和环境因子数据,通过地理探测器分析辨识了人口分布的显著影响因子,进而构建了基于随机森林回归算法的人口空间分布模型,最后以史学界考订的历史人口数据为基础,重建了1776~1953年6个时间断面中国传统农区10km×10km分辨率的人口空间分布,并分析了人口分布的时空变化特征.研究发现:(1)显著影响中国传统农区县域之间人口密度差异的主要环境因子包括海拔、坡度、地势起伏度、距地区(州
期刊
通过第一性原理研究了二维单层CrS_2与双层CrS_2/MoSe_2体系的原子结构和磁性结构.利用广义布洛赫条件计算了自旋螺旋的能量与自旋螺旋波矢之间的色散关系E(q),并通过海森堡模型拟合该曲线,分别得到了单层CrS_2体系和CrS_2/MoSe_2双层体系的多近邻海森堡作用(HBI)参数J_1–J_6.然后通过拟合得到的HBI参数作出全布里渊区的E(q).研究发现,非磁性单层MoSe_2与单层
期刊
以广东省农村地籍调查数据为基础,结合GIS空间分析方法,对农村宅基地房屋的利用、结构、空间分布等特征进行分析,结果表明:1)研究区内农村宅基地房屋以一层、砖结构和混合结构为主,空间分布存在明显的地域差异性。同时层高与结构间的空间分布存在一定相关性,低层与砖、混合结构房屋主要分布在粤北及粤西等偏远地区,高层与砼结构房屋多集中在珠三角地区。2)研究区内农村宅基地房屋空置、闲置现象普遍,平均空置率和闲置
期刊
在实际工程应用中随机变量可能会服从多峰随机分布,如火车减振器在长期使用后的阻尼特性和安全切割试件修复后的疲劳寿命等.传统的不确定性传播方法主要用于处理单峰随机分布问题,而在处理多峰随机分布问题时容易产生较大误差.本研究提出了一种针对多峰随机分布的不确定性传播分析方法.首先,使用高斯混合模型建立多峰随机变量的概率密度函数;其次,发展了一种高效三元降维法计算响应函数的高阶统计矩,该方法可以有效提高不确
期刊
无监督领域自适应(UDA)作为实现迁移学习的一种方法,将有标签的源域上的知识迁移到类别相同特征不同的目标域中,目的在于匹配源域和目标域的概率分布以达到迁移学习目的。现有的领域自适应方法在匹配分布时并未完全考虑伪标签置信度或伪标签损失计算问题,针对此类问题,提出循环选择伪标签分类模型(CSPL)。利用深度网络提取图像特征,为目标域打上高置信度伪标签使得训练数据增强,采用MMD距离度量方法对齐源域和目
期刊