论文部分内容阅读
计算语言学作为一门交叉型的新兴学科,将语言学、数学和计算机科学紧密结合在一起,是促进国际间语言交流和科技发展的重要前沿学科。计算语言学科研论文的英文摘要作为正文之首,是论文内容的高度浓缩与概括,具有使读者快速了解论文研究背景、研究目的、研究方法、研究结果以及研究价值的重要作用,是国际学术交流的重要桥梁和科技成果互享的重要载体。并且,英文摘要很大程度上影响了国内外各类大型学术会议和各大核心期刊对论文的收录与转载。因此,撰写规范而严谨的计算语言学论文英文摘要对于提高国际间语言科技成果交流、促进计算语言学学科蓬勃发展具有十分重要的意义。为了帮助母语为非英语的国内学者更为规范地撰写计算语言学论文英文摘要,提高我国语言科技成果在国际上的影响,本文以2010-2014年期间的756篇国际计算语言学协会(ACL)会议长文的英文摘要和2010-2014年期间的284篇国内核心期刊《中文信息学报》计算语言学方向的论文英文摘要作为研究对象,构建起中外计算语言学论文英文摘要语料库,并对其进行标注、统计与分析。通过结合使用语料库法、统计方法、定性与定量相结合等方法,本文总结出了当今国际计算语言学论文英文摘要的写作规范:(1)摘要长度一般控制在4-6句、90-140字;(2)摘要类型应采用信息型;(3)摘要结构中引言、方法和结果是必有的,且引言部分应注重研究背景、问题、主题和目的的介绍,特别是背景介绍;(4)摘要动词时态以一般现在时为主、动词语态以主动态为主、第一人称代词多使用“we”。基于本文构建的中外计算语言学论文英文摘要标注语料库,通过结合使用语料库软件、人工筛选、汉语翻译等方法,本文还构建了计算语言学论文英文摘要的常用术语英汉知识库(269条)、计算语言学论文英文摘要的常用普通动词英汉知识库(116条)和计算语言学论文英文摘要的常用句型模板知识库(325条),并设计出简易的英文摘要助写软件,切实帮助母语为非英语的国内研究者更为规范而便捷地撰写出更为地道的计算语言学论文英文摘要。此外,本文构建的计算语言学论文英文摘要的常用术语知识库和常用句型模板知识库还可分别应用于国外作文自动评分系统E-rater的内容分析模块和句法多样性分析模块,从而帮助E-rater更为准确地评判与计算语言学领域相关的作文内容质量和语言质量。