论文部分内容阅读
随着计算机技术的高速发展,程序设计教学正在受到各个学校越来越多重视。国际大学生程序设计竞赛(ACM International Collegiate Programming Contest,简称ACM/ICPC)作为一种全新的培养计算机科学顶尖学生的方式很快受到各个大学的积极响应。目前有很多ACM程序设计选手积累自己平时做题的解题思路,并将这些解题思路上传到他们的Blog上以分享给程序设计爱好者参考学习。这些题解报告都是分散地存在网络上,但有些题目之间很类似,重复学习不能带来实质性的进展。目前有一些大牛来根据自己多年的做题经验进行总结分析自己所做过的题目,很多初学者跟着大牛的脚步在前进。但是互联网上的题目浩如烟海,单凭个人的人力是很难对其进行全面的研究。因此,需要一种有效的方法来分析解题报告,包括其中的解题思路和程序代码。最终在解题思路与解题思路之间建立联系,在程序代码与程序代码之间建立联系,和在解题思路与程序代码之间建立联系,形成三维一体的有机体,从而更有效地进行教育教学以及个性化学习。本文分别对解题报告中的程序设计代码和解题思路进行分析处理,具体如下:1)对JAVA程序代码的处理。首先,由于JAVA程序代码编写的灵活性,直接将其送给机器进行处理会比较麻烦。本文将其进行词法分析和语法分析转换成与其一一对应的语法树,处理起来方便了很多。然后,本文想让机器能够根据语义自动处理这些数据,但语法树中并没有明确的语义标签,因此我们了结合拥有语义标签的本体技术,将JAVA程序代码使用本体表示。其次,JAVA程序代码使用本体表示后,我们可以自己写代码来检索想要的算法结构。但这样比较麻烦,本文通过本体查询语句描述算法结构来查询算法,并且这些查询语句是根据代码或伪代码自动生成的。本体查询语言的语法规则很适合描述算法结构,并且本体查询语言拥有强大的推理能力,为算法识别提供了很好的支持。最后,将算法使用本体查询语言描述查找类似的算法,根据查询结果在算法之间建立联系。2)对解题思路的处理。参加ACM比赛的学生很多,数以万计的题目以及解题报告分散在网络中。课题组中已有同学根据专家库中预定义的算法类别对解题报告进行分类,但是预定义的专家库具有一定的局限性。本文首先使用自然语言处理技术处理解题报告中的解题思路,自动获取算法名,形成知识库,用于对题目分类。解题思路中很多描述算法的语句具有一些特定的模式,本文使用斯坦福大学的中文分词器和解析器工具,对这些语句按照特定的模式进行分析处理,自动获取算法名,形成知识库。有了知识库后,我们就可以在解题思路中查找知识库中所包含的算法,并根据具体的算法在解题思路之间建立联系。由于解题报告中解题思路与程序代码是一一对应的,根据一个解题思路,我们可以找到与其有关系的其他解题思路所对应的程序代码,最终在解题思路与程序代码之间建立联系。