Syntactic Tagging on Modern Chinese Special Sentence Patterns Based on Information Dependency Langua

来源 :重庆大学 | 被引量 : 0次 | 上传用户:kunming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语料库是语言研究与教学的重要基础,具有重要的应用价值。目前语料库建设已经从量的积累转向质的提升,如何通过语料标注对语料进行精加工,成为语料库语言学研究的热点和难点问题。当前大多数语料库的标注还集中在词法层面,句法标注的规模有限。传统形式化句法理论(例如短语结构语法、依存语法)还不够成熟,无法应用于语料库中的大规模句法标注实践。信息依存语言模型(Information Dependency Language Model,IDLM)是李良炎(2009)提出的一种面向语料库建设的句法标注理论。该理论整合了短语结构语法和依存语法的描写能力,借鉴了认知语法的概念自主依存原理,注重语言描写与解释,具有句法语义一体化的特点。作为一种新理论,在应用于语料库建设之前,需要结合具体语种对传统句法研究中存在的难点和热点问题进行深入分析,以探索这一理论的适用性,并初步形成句法标注规范,从而为大规模句法标注奠定理论和知识基础。
   现代汉语中存在大量的特殊句式,是现代汉语研究的难点和热点。传统研究主要从语言学角度对各种特殊句式分别研究,一直以来争议不断。还没有看到有人从语料库建设的角度对现代汉语的各种特殊句式进行系统的形式化分析和整理。本文通过对传统研究文献的梳理,确定了四种有代表性的现代汉语特殊句式,以IDLM为理论基础进行形式化分析,给出句法标注的理据和表达式。研究目的在于:一方面验证IDLM对现代汉语的适用性,另一方面完成对现代汉语几种代表性特殊句式的标注。本文是将IDLM应用于现代汉语语料库建设的预研究。
   本文共有五个章节。第一章是绪论,介绍了研究背景、研究内容以及研究的价值和意义。第二章为文献综述,包括对相关语料标注领域和语言学领域研究现状的梳理和总结。第三章为理论基础,详细介绍了IDLM理论的原理和句法语义分析过程。第四章对各特殊句式进行了句素关系分析和IDLM结构分析,并在此基础上对其进行了句法语义解读。第五章为全文结论。
   本文创新之处在于:尝试在充分考察传统语言学研究成果的基础上,以面向语料库的形式化句法理论--IDLM来研究现代汉语特殊句式,从而有别于相对孤立的传统语言学研究和传统句法标注研究;通过对几种代表性现代汉语特殊句式的研究,使IDLM在现代汉语分析方面的应用更加深入;IDLM对某些特殊句式的标注不够直观和简洁,本文通过缩写形式予以简洁标记。
   通过研究发现:IDLM句法标注理论将句素之间以及句素内部的各种关系呈现为一个个多元结构,再通过联合或嵌套的方式相互关联,符合人们认知逻辑和行为经验,方便了计算机对自然语言的学习和语言信息的提取。该理论的提出打破了当前语料标注在词法层面停滞不前的僵局,为语料标注的进一步发展提供了参考,具有深远的实践意义。
   总之,IDLM理论以简洁的信息依存表达式和直观的信息依存图实现了对句法结构的形式化,其标注结果符合句子的真实语义,对特殊句式具有较好的描写能力,可供计算机检索使用。这些研究成果为大规模语料库建设作出了准备,是对传统研究的有益补充。
  
其他文献
学位
学位
学位
学位
在过去的几十年里,无论在国外还是中国,人们积极探索学习者自身对于语言学习的影响。其中,语言学习策略的研究呈现出百花齐放的态势,包括善学者和不善学者的策略研究,并因此衍生出了一大批关于学习策略定义和分类的研究。同时,研究者们对于学习策略与语言能力的关系,以及影响学习者策略的因素给予了充分的关注。词汇是学习外语的基础,学习策略被认为是影响学习成绩的重要因素之一,因此对学生英语词汇学习策略的探索非常的必
学位
学位
学位
学位
学位