数据库自然语言查询及代码相似匹配研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:j621212
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据库技术是信息化社会的重要基础,数据库课程是国内高校计算机专业的必修课程。数据库教学中高效能、高质量实验技能训练,对提高课程的教学质量起着至关重要的作用。因此,构建一个高效的在线实验学习环境,使学生在学习中能够再学习、能够检验自己的学习效果,对改善教师疲于应对学生的共性问题,对实验教学环节能进行量化考核,准确地掌握和评价每个学生的能力,促进学生分析问题和解决问题能力的提高有着十分重要的现实意义。   籍此,在研究自然语言处理技术及代码自动评估的基础上,采用改进后的数据库模式提取技术抽取自然语言描述的查询要求中包含的信息,构造语义依存树并转化为等价的SQL代码。采用静态分析方法,通过构造抽象语法树并计算目标代码和源代码的树编辑距离来对学生提交的代码进行评估。同时,在评估过程中,针对出错节点推送相关知识,为解决学习过程中出现的问题提供及时的帮助。   本文的主要工作如下:   1)研究自然语言数据库相关技术,借鉴受限领域自然语言处理方法,通过构造结构化的字典作为自然语言分析处理的基础,为分析自然语言查询要求提供充足的辅助信息;   2)引入词性标注信息,优化数据库模式提取技术,通过构造集合块的方法分析语义依存树并将其转化为等价的SQL代码;   3)研究常用的代码相似度评估技术,借鉴语言编译过程中的处理方法,通过静态分析代码结构,构造等价抽象语法树的方式完整保存代码语法信息,并采取树编辑距离作为评估代码相似度的依据,对于存储过程的匹配引入匹配向量记录变量依赖关系。计算过程中引入结点权重因子以体现不同考察点的重要性;   4)构造结点-知识点关联集,在代码匹配的异同点自动向用户推送相关知识点供用户参考学习;   5)论文对数据库实验学习支撑平台原型系统进行了设计与实现。通过实际运行该学习支撑平台验证本文研究内容的可行性,测试各个功能模块的实用性。  
其他文献
随着Web的迅猛发展,Web上网页的数量已经超过万亿级,并且其中大部分都是深层网络(Deep Web)的数据。这些数据呈现出规模巨大、结构化程度高、动态性与异质性并且按领域分布的
随着传感器、图像处理技术的飞速发展,图像融合已成为信息领域的热点课题之一,其应用潜力得到了充分的关注与重视。一方面图像融合广泛应用于目标探测、识别与跟踪等军事领域
为了保护智能手机免受恶意代码的攻击,学术界在Android恶意代码检测方面进行了大量的研究,所采用的技术大体上可以分为静态分析和动态分析两个方面。控制流程图是静态分析中的
物化视图(Materialized Views),也可称之为快照,可以用来存储远程数据的副本,被广泛应用在数据仓库和联机分析处理等各项应用中。随着数据挖掘等研究的不断深入,数据仓库中不
气候变化所引起的环境问题已引起各国政府的密切关注。本文以长江中下游地区的池州市、铜陵市及位于皖中沿江平原地区的长丰县为研究区域,主要做了以下三个方面的工作:1)对池州
近年来随着交通技术的进步,交通设施不断得到改善,智能交通系统(ITs,Intelligent Transport System)的应用也越来越广泛。智能交通系统中的交通诱导子系统是出行和运输管理系
随着以太网的普及和宽带应用的发展,光纤到户(FTTH)被普遍认为是一种理想的综合接入方案。自2003年起,ITU-T陆续推出了G984.X系列标准来定义吉比特级无源光网络(GPON)系统。G
边缘是图像最基本的特征。边缘检测是图像处理领域最重要的研究课题之一,在模式识别、纹理分析、特征提取领域有着广泛的应用,受到学者的广泛关注。目前在边缘检测研究领域已
现代计算机技术的迅猛发展极大地促进了科学计算可视化的发展,二维离散矢量场可视化是科学计算可视化的重要组成部分。目前,可视化的应用领域十分广泛,几乎涉及自然科学与工
时延测试是检验电路时序正确性的有效手段,作为集成电路测试的一个关键环节,在芯片制造中被广泛使用。国际半导体蓝图预测2020年集成电路特征尺寸将达到10纳米,不断提高的工