【摘 要】
:
数据库的自然语言接口的研究一直受到广泛关注,因为它允许非专家使用自然语言进行数据库查询,具有较高的应用价值。最近随着数据集的丰富,基于深度学习的方法越来越多。但同
论文部分内容阅读
数据库的自然语言接口的研究一直受到广泛关注,因为它允许非专家使用自然语言进行数据库查询,具有较高的应用价值。最近随着数据集的丰富,基于深度学习的方法越来越多。但同时数据集都是英文领域,需要使用一定的跨语言迁移方法进行模型迁移才能在中文领域应用。本文关注英文数据集WikiSQL提出的SQL生成任务,对数据集进行仔细分析后,发现了其中存在部分包含常识或领域知识的条件列不会被明确提及,而是隐含在自然语言查询语句中的情况,导致这一类条件的预测并不顺利。为了解决这一问题,本文在无外部知识引入的情况下提出了使用自然语言序列中的条件值序列辅助条件列推测任务的方法,对SQL生成模型进行了改进。主要改进了以下两点:第一,交换了条件值任务与条件列任务的顺序,这样可以先通过条件值任务获得条件值序列,以指导条件列任务的推测;第二,以序列标注任务的方法解决条件值任务,不仅提高了条件值准确率,也使得模型可以一次性获得全部的条件值序列。同时本文为了将模型应用至中文质检领域,使用了机器翻译技术将原英文数据集翻译成了中文,依据质检公司数据库人工标注了一个小型的质检数据集,并使用跨语言预训练语言模型的方法进行模型迁移。最终实验结果显示模型在测试集上的执行结果准确率提升了4.9%,证明了方法的有效性。同时经过跨语言迁移,模型在中文数据集上获得了 65.7%的执行结果准确率。最后开发了面向质检公司数据库的SQL生成工具原型,表现达到预期。
其他文献
贫困问题是困扰人类社会的长期问题,一直以来,我国都在致力于反贫困工作中。改革开放以来,我国贫困人口减少了约2.5亿人,贫困发生率由30.7%下降到1.7%。在互联网不断发展的今天,网络扶贫成为扶贫新方向,其中的电商扶贫也成为脱贫攻坚的有效手段。农村电商可以推动贫困地区经济发展、促进贫困人口增收,大范围带动贫困人口脱贫。因此,对电商扶贫路径和作用机制的研究可以明确农村电商是如何带动脱贫的,从而提出电
随着国家“智慧城市”概念的提出,城市地下智慧管廊系统的设计与实现越来越被重视。如何利用现有的物联网技术对城市地下管廊运营与管理,提高管廊工作的效率和质量成为“智慧城市”工程建设中的重要研究课题之一。为了提高智慧管廊信息管理效率,本文提出了一种基于RBAC的智慧管廊信息管理系统的设计与实现方案。该方案采用RBAC、AOP和拦截器等技术,将用户-角色-权限分离,通过设计角色树和拦截器来进行鉴权,并且通
目的应用视频多导睡眠监测及相关量表对伴快速眼球运动睡眠行为障碍的帕金森病患者进行发病率、临床特征及睡眠相关分析探讨。方法选取28例伴快速眼动睡眠行为障碍的帕金森病
自2013年起,我国市场监管改革的方式起初是“自下而上”的,即先由地方市场监管机构整合工商、质监与食药监等部门并进行试点,后中央于2018年组建市场监管总局。总局成立后各地市场监管部门开始“自上而下”深化改革,安徽省成立市场监督管理局,各县区全面推进执法力量下沉。深化C市市场监管机构改革主要分为三个主要时期。第一时期:2014年工商、质监、食药监三合一,以工商为框架的市场监管导向。第二时期:201
混沌是对一类复杂、无序运动的概括,表现出对于微小变化的极端敏感。将混沌的阶延伸到分数的范围,得到分数阶混沌模型。阶次的变化使得分数阶模型表现出更为复杂的演化轨迹,演变出许多分数阶混沌特有的性质。这在一定程度上推动了分数阶混沌的发展。同步在混沌实际应用过程中扮演着重要角色,指控制两个或多个混沌系统状态轨迹趋向一致。鉴于分数阶混沌模型的潜在优势,研究与实现具有分数阶模型的混沌同步具有更重要的理论与实践
随着现代化社会的不断进步,太阳能作为一种清洁能源已广泛应用于环境污染的治理中,而工业固氮因为高温高压、能耗大等诸多因素受到极大的限制,因此,寻找一种清洁环保低能耗的固氮方式就显得尤为重要。本文以Bi OBr为基础,通过表面构造“结”型复合材料的方法来提高光生电子-空穴的分离,首先,将其与半导体材料g-C_3N_4复合形成异质结,提高光生载流子的分离;其次,通过表面负载贵金属拓宽可见光吸收范围,提高
孪生支持向量机作为支持向量机的拓展,它不仅具有较快的运算速度,而且具有较强的泛化能力,在股票预测方面取得了良好的应用效果。然而,由于股票市场的复杂性和随机性,股票数据中存在着很多的噪声点和离群点,这在一定程度上影响了孪生支持向量机的预测效果。基于此,本文在孪生支持向量机的基础上,将q阶正交模糊数应用到孪生支持向量机中,提出了q阶正交模糊孪生支持向量机(q-ROFTSVM),并将其应用到股票价格趋势
本文对理想蛋白的研究历史、现状及应用前景进行了讨论,分析了动物理想蛋白的各种研究原则和研究方法。对于比较权威的理想蛋白模式进行了分析,提出了在畜禽生产实践中应用时
海上吊装是目前海上工作过程中常见的作业方式。在进行海洋吊装补给作业时,由于海风、海浪的作用影响,船舶会产生多个自由度的姿态运动,严重影响了正常的作业过程,对货物及人员安全构成极大威胁。因此,需要一种具备主动补偿功能的吊装方式来提高海上吊装的安全性。为了实现海上吊装工作的安全作业,本文对采用多自由度主动补偿进行海上吊装进行了研究。本文的主要内容如下所示:(1)本文研究采用多自由度主动补偿方法海上吊装
随着科学技术和智能制造的快速发展,AGV越来越智能化,广泛应用于物流仓储、制造业和汽车等行业。一旦AGV发生故障,AGV可能会受损,严重时会造成巨大的经济损失。传统故障诊断方法存在难以建立精确的系统模型和故障诊断只关注当前时刻系统参数等问题,针对现有研究的问题,本文致力于研究基于深度学习的AGV故障诊断算法,引入深度学习技术,实现对AGV故障的即时监控和精准甄别,为工作人员及时排除故障,保证系统平