基于自然语言理解的主观试题自动批改技术的研究与初步实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:lwfpa1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机辅助处理、多媒体技术以及计算机网络等技术的飞速发展和推广应用,网络教学将成为一种最具应用前景的远程教育模式,并从根本上改变人们的学习方式。在线考试是网络教学系统必备功能之一,其涉及到多项关键技术。其中,试卷的自动化批改技术对于大规模在线考试是非常有意义的,它不仅可以节省大量手工批改的工作量,并且可以直接得到考试的结果数据,特别在智能化组卷方面可以利用自动批改功能及时了解学生的考试情况,动态地调整试题的难度和考核的知识点等,是计算机自适应考试的基础,同时试卷的自动化批改也是考试结果点评和个性化分析的基础,具有很大的实际应用价值。 对不同的试题类型,试卷自动化批改的难易程度相差很大,客观试题的自动化批改易于实现,主观试题的自动批改实现起来则相当复杂,这在一定程度上使得在线考试不能真正实用化,从而成为制约网络教学发展的一个重要因素。自20世纪60年代以来,国外许多专家和学者就致力于基于任意文本答案的主观试题的计算机自动批改技术的研究,同时也出现了各种不同的自动批改系统。相比之下,我国相关研究起步较晚,实用系统也很少见到。本文主要针对自动批改技术中的难点——主观试题的自动批改进行了研究,并取得了一定的成果。 目前大多数自动批改系统都采用基于自然语言处理的方法。一般自然语言理解系统的实现是非常复杂的,这种复杂性是由人类自然语言自身的复杂性所决定的,但如果是面向特定需求、特定领域的自然语言理解,则可以适当简化问题的复杂性。为此我们采取“寻找突破,先易后难”的策略,以专业性强、试题答案的正确与否易于判断的客观性较高的自然学科如计算机、物理、生物等作为我们的研究对象,实现部分主观试题自动化的辅助批改。 在研究中,所采取的技术路线是利用自然语言理解的思想、方法和技术,来研究和解决自动批改中的关键问题。具体地讲: (1)利用自然语言理解中的词法分析技术对学生答案和领域专家提供的标准答案进行词语切分,并标注词性,为句子结构解析和提取做好准备。 (2)利用自然语言理解中的句法分析技术解析句子的结构,提取其中短语成份并标识部分语义信息,供后面评分模块使用。 (3)借鉴基于实例的机器翻译中的语句相似度研究经验来定义语义相似度计算模型,进而根据该模型计算学生和领域专家的答案之间语句的语义相似度。本文的主要研究工作包括以下两个方面: (1)领域概念知识库的建立与描述我们构建了一个语义关系的网络结构,在这个语义网络中,概念之间通过既定的17种关系相互连接。其中,两个概念可以通过一个或多个语义关系连接起来,形成一条或多条语义关系路径。为使这个语义网络可供计算,我们为每条边赋予一定的权值(在0~1之间),该权值表示了这两个概念在语义上的相关或相似程度。通过给定的算法,我们可以获得任何两个领域概念之间的语义相似度,为进一步计算语句的相似度奠定基础。 (2)语句相似度定义及计算模型的建立和实现我们针对系统的具体实现和汉语的特殊性,同时借鉴机器翻译领域内一些对语句相似度的研究,在此基础上提出了基于动态规划的语句相似度计算方法。其主要思想如下:仅对语句进行浅层句法结构分析,由此得到句子的浅层句法信息,即组成句子的短语及其语法属性和部分语义信息;将匹配分为整句级和短语级两层,首先利用关键词匹配法实现短语级匹配,然后,在此基础上,在整句级利用动态规划算法对短语的相似度矩阵进行计算,找出一条相似度值最大的路径,该值就是所要求的语句相似度。 通过具体的实验测试可以看出,本文的主观试题自动批改系统基本可以满足系统设计的需求,下一步要做的是对系统进行完善和改进,例如实现领域概念知识库的自动创建、加强系统的歧义处理能力、强化系统对那些影响批改效果的特殊语法现象的识别和处理能力等。
其他文献
流媒体应用的广阔前景推动了流媒体技术的研究,各项关键技术也随之不断进步。但流媒体本身的高资源消耗特点与服务器出口带宽、网络带宽限制之间的矛盾,使流媒体系统的性能和服
在众多的安全协议分析方法中,基于串空间的形式化分析方法是当前的研究热点之一。串空间理论发展过程中有两个重要事件:其一是Guttman提出的串空间模型认证测试方法;其二是So
随着多元分析、数据挖掘技术的不断发展,计算手段的日益更新,人们对数据挖掘的要求也愈来愈高。在实际应用中,为了找出感兴趣的知识,常会碰到带约束条件的问题。带约束的聚类问题
互联网络正以惊人的速度改变着人们的工作和生活方式,从机构到个人都在越来越多地通过互联网或其它电子媒介发送电子邮件、互换资料,这无疑给社会、企业乃至个人带来了前所未有
现在大多数企业使用的传统的管理软件注重的是解决企业应用层现存的问题。由于缺乏对外界环境变化作出快速响应的能力,已经越来越难满足现代企业发展的需要。工作流技术是对企
随着网络入侵方法和网络计算环境的复杂化,入侵检测的研究和应用也越来越多的转向分布式入侵检测系统。在分布式入侵检测系统中,各组件间需要进行大量信息交互,为了确保交互
本课题来源于由本人主持的2007年潍坊市职业教育重大课题研究与实践项目,研究的主要内容是在高职计算机课堂教学中如何构建和实践任务驱动教学。论文在广泛调查研究、分析的基
医学影像存档与通讯系统(PACS)是计算机技术与医学影像技术结合的产物,医学数字图像通讯标准(DICOM)是在医学信息学领域中有关医学图像的国际标准,它可以使医学图像设备的制造商和
随着我国电力体制改革的深化,以及电力市场的逐步放开,火电企业之间的竞争越来越激烈。因此如何提高火电企业的管理水平,降低企业生产成本,是摆在火电企业和管理人员面前的一道难
本文针对软件移植技术展开深入研究并设计了一个从Windows到Linux的软件移植辅助工具W2L(Windows to Linux),W2L就是辅助将Windows下的Delphi应用程序移植到Linux平台下,经重新