论文部分内容阅读
随着计算机辅助处理、多媒体技术以及计算机网络等技术的飞速发展和推广应用,网络教学将成为一种最具应用前景的远程教育模式,并从根本上改变人们的学习方式。在线考试是网络教学系统必备功能之一,其涉及到多项关键技术。其中,试卷的自动化批改技术对于大规模在线考试是非常有意义的,它不仅可以节省大量手工批改的工作量,并且可以直接得到考试的结果数据,特别在智能化组卷方面可以利用自动批改功能及时了解学生的考试情况,动态地调整试题的难度和考核的知识点等,是计算机自适应考试的基础,同时试卷的自动化批改也是考试结果点评和个性化分析的基础,具有很大的实际应用价值。
对不同的试题类型,试卷自动化批改的难易程度相差很大,客观试题的自动化批改易于实现,主观试题的自动批改实现起来则相当复杂,这在一定程度上使得在线考试不能真正实用化,从而成为制约网络教学发展的一个重要因素。自20世纪60年代以来,国外许多专家和学者就致力于基于任意文本答案的主观试题的计算机自动批改技术的研究,同时也出现了各种不同的自动批改系统。相比之下,我国相关研究起步较晚,实用系统也很少见到。本文主要针对自动批改技术中的难点——主观试题的自动批改进行了研究,并取得了一定的成果。
目前大多数自动批改系统都采用基于自然语言处理的方法。一般自然语言理解系统的实现是非常复杂的,这种复杂性是由人类自然语言自身的复杂性所决定的,但如果是面向特定需求、特定领域的自然语言理解,则可以适当简化问题的复杂性。为此我们采取“寻找突破,先易后难”的策略,以专业性强、试题答案的正确与否易于判断的客观性较高的自然学科如计算机、物理、生物等作为我们的研究对象,实现部分主观试题自动化的辅助批改。
在研究中,所采取的技术路线是利用自然语言理解的思想、方法和技术,来研究和解决自动批改中的关键问题。具体地讲:
(1)利用自然语言理解中的词法分析技术对学生答案和领域专家提供的标准答案进行词语切分,并标注词性,为句子结构解析和提取做好准备。
(2)利用自然语言理解中的句法分析技术解析句子的结构,提取其中短语成份并标识部分语义信息,供后面评分模块使用。
(3)借鉴基于实例的机器翻译中的语句相似度研究经验来定义语义相似度计算模型,进而根据该模型计算学生和领域专家的答案之间语句的语义相似度。本文的主要研究工作包括以下两个方面:
(1)领域概念知识库的建立与描述我们构建了一个语义关系的网络结构,在这个语义网络中,概念之间通过既定的17种关系相互连接。其中,两个概念可以通过一个或多个语义关系连接起来,形成一条或多条语义关系路径。为使这个语义网络可供计算,我们为每条边赋予一定的权值(在0~1之间),该权值表示了这两个概念在语义上的相关或相似程度。通过给定的算法,我们可以获得任何两个领域概念之间的语义相似度,为进一步计算语句的相似度奠定基础。
(2)语句相似度定义及计算模型的建立和实现我们针对系统的具体实现和汉语的特殊性,同时借鉴机器翻译领域内一些对语句相似度的研究,在此基础上提出了基于动态规划的语句相似度计算方法。其主要思想如下:仅对语句进行浅层句法结构分析,由此得到句子的浅层句法信息,即组成句子的短语及其语法属性和部分语义信息;将匹配分为整句级和短语级两层,首先利用关键词匹配法实现短语级匹配,然后,在此基础上,在整句级利用动态规划算法对短语的相似度矩阵进行计算,找出一条相似度值最大的路径,该值就是所要求的语句相似度。
通过具体的实验测试可以看出,本文的主观试题自动批改系统基本可以满足系统设计的需求,下一步要做的是对系统进行完善和改进,例如实现领域概念知识库的自动创建、加强系统的歧义处理能力、强化系统对那些影响批改效果的特殊语法现象的识别和处理能力等。