论文部分内容阅读
篇章标注旨在揭示跨句子(句子间、段落间)的深层关系,并将之结构化,通过规范的标注体系呈现出复杂的篇章内部关系。篇章标注是语言资源建设的重要内容,为篇章分析提供了坚实的基础。本论文对篇章标注的规范和应用进行了初步的探索,开发完成了篇章标注平台,并在此基础上辅助人工构建了一个篇章标注语料库。 本论文参考传统的篇章理论(如修辞结构理论、谓词论元理论)和与其相应的篇章标注语料库(如RST-DT,PDTB),并结合汉语领域语料的特点,提出一套较易于标注操作的篇章标注体系。这套体系从内容、关系、指代三方面描绘了篇章内部的深层结构与含义。为了便于研究人员开展标注,并保持标注的一致性,本工作独立设计并开发了全新的篇章标注平台。通过这个平台,研究人员可以对篇章进行分段分句、内容标注、关系标注和指代标注,标注过程和结果都能准确、直观地显现。利用篇章标注平台在医学领域语料上尝试人工标注,构建了医学篇章标注语料库。对人工篇章标注结果的分析表明了所提出的标注体系同时兼顾了篇章内容的表示和可操作性。同时,本文将标注结果用于医学领域问答,验证了篇章体系设计的合理性。