基于Word2Vec-LSTM模型的统计文献领域语义解析研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:ait123123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义解析是实现自然语言向计算机可执行的规范化表示转化的一项技术。它作为人工智能的一个分支,是自然语言处理领域的热点问题,也是智能系统研究的核心技术,为机器翻译、智能搜索、人机对话等应用提供了基础。随着科学技术的不断发展,数据库的应用范围越来越广,不仅应用在企业的生产中,许多个人和研究机构也开始应用数据库技术。而掌握SQL语言则成为使用数据库的前提,对于那些不熟悉SQL语言的用户来说,数据库中的数据并没有发挥其最大价值。因此,要想让数据库中的数据服务于更多的用户,必须打破自然语言和SQL语言的界限,成功将自然语言转化为计算机可执行的数据库语言,而语义解析对于这一目标的实现发挥着至关重要的作用。由于统计专业领域相比百科领域更为复杂,而且缺少针对统计领域的公开数据集,所以目前针对统计专业领域的语义解析研究相对较少。基于上述原因,本文以数据库的自然语言查询接口作为应用场景,改进现有的基于LSTM的英文语义解析模型,并将其应用在统计领域的语义解析任务上,将自然语言问题转化为数据库查询语言。帮助更多的用户不依赖SQL语言就能实现对数据库信息的查询功能,增强数据的共享性和实用性,从而扩展数据库的应用场景和使用范围。主要工作包括:(1)针对专业领域文本数据专业性强的特点,本文在现有的LSTM语义解析模型中引入Word2Vec词嵌入模型。借助Word2Vec词嵌入模型,将文本数据向量化,实现文本的特征提取和表示,构建用于专业领域语义解析的词向量,减少统计领域专业性强带来的影响。(2)构建了一个专属于统计领域的NL2SQL数据集,弥补了统计领域语义解析研究缺少公开数据集的问题。在数据集中,每一条数据都包含两部分,分别是自然语言问题和对应的SQL查询语句。(3)实现了融入词嵌入的Word2Vec-LSTM语义解析模型,并以本文构建的统计领域数据集和词向量为训练数据进行实证研究,在训练过程中,对模型中Batch-size和激活函数两个部分进行调整,最终实现自然语言向SQL语句的转化。结果表明:加入词嵌入的深层神经网络的语义解析模型能够更好的适用于专业性强的统计期刊数据,经过对比研究,最终发现,当Batch size=26并且激活函数选用PReLU时模型预测准确率最高,相比基于LSTM的语义解析模型提升了 7.3%。
其他文献
<正> 高等院校的情报工作是其教学、科研以及管理等工作的一个重要组成部分,起着尖兵、耳目和参谋的重要作用。搞好这一工作,不仅对提高高校的教学、科研和管理水平,而且对振兴我国经济,加速四化进程,
<正> 引言转眼行将五十年, 湖边犹记柳如烟。古稀已遇君仍健, 征路方长我尚全。枯守芸编春寂寂, 愁倚书案雨绵绵。几多史册曾经手, 白发难温夙昔缘。这首七律是1977年作家姚雪垠同志书赠河南省图书馆馆员薛连仲同志的,在精美的条幅左款,还有作家的附记: 约在一九三三年春,余离业留居开封,常到河南省图书馆看书,薛连仲同志时为青年馆员,每日静坐柜台内,司图书出纳,余读书较杂,曾借阅
一、病例摘要 患者男,30岁,甘肃籍民工。因发热5天,乏力、纳差、恶心、呕吐、眼黄尿黄1天入院。5天前患者于所在地出现发热,体温未测,未予重视,仍前往高原(海拔4700m)从事重体力工作
此论散文的艺术空间,不是题材范围,而是作品中思想内容所涉及的时空范围及结构跨度。它包括自然时空和思想内涵,也包括层次、段落、句子相互间及它们内部的结构关系。散文的艺术空间首先决定于作品的思想内容。结构形式中形成的空间可使作品藏象外之旨,有言外意,显示出“含蓄”的风格特点。
<正> 当前,我们国家正在沿着社会主义方向进行一系列改革。一切战线,一切地区,一切部门,一切单位都有改革的任务,都要破除陈旧的、妨碍我们前进的老框框、老套套、老作风,都要钻研新情况,解决新问题,总结新经验,创立新章法。图书馆作为国家文化科学教育事业的重要组成部分,改革的任务同样十分繁重。图书馆的馆风建设问题,就是图书馆改革的一项重要内容。
根据玉米地和对照地的平行观测资料,分析了玉米发育过程中的根系吸水情况、作物耗水特点以及水分的供需矛盾。提出了玉米生长发育和产量形成过程中的需水关键期概念,并引入了作
<正> 随着党校教育的正规化,党校系统图书馆正经历着一场深刻的变革。为了使流通工作更好地为党校的教学科研服务,必须进行改革。1、变革旧的观念,增强服务观念。长期以来,党校系统图书馆存在着一种轻视流通工作的倾向,不少人看不起这项工作,不安心干这项工作,总觉得搞流通工作是“借借还还”伺候人的工作。这是一种传统的世俗偏见。在改革中,我们必须变革这种旧的观念,正确认识流通工作在图书馆的地位和作用,增强服务观念,热爱这项工作,努力创造第一流的服务,最大限度地满足读者的需求。
<正> 武汉大学图书情报学院邱均平编著的《文献计量学》,将于今年12月由科技文献出版社出版。全书共12章,包括科学文献的增长规律与老化规律,布拉德福定律、齐普夫定律和洛特卡定律的介绍,以及文献统计分析法、数学模型分析法、引文分析法在图书情报管理与研究中的应用等;读者对象为
利用研制的地表热量平衡各分量的气候计算方法,结合全国6个热平衡站资料,计算并讨论了地表热源在全国的分布特征,分析了地面对大气加热的特点以及地表热源的参数化问题。指出季风