篇章标注平台开发及应用

来源 :北京大学 | 被引量 : 0次 | 上传用户:dfjds
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
篇章标注旨在揭示跨句子(句子间、段落间)的深层关系,并将之结构化,通过规范的标注体系呈现出复杂的篇章内部关系。篇章标注是语言资源建设的重要内容,为篇章分析提供了坚实的基础。本论文对篇章标注的规范和应用进行了初步的探索,开发完成了篇章标注平台,并在此基础上辅助人工构建了一个篇章标注语料库。  本论文参考传统的篇章理论(如修辞结构理论、谓词论元理论)和与其相应的篇章标注语料库(如RST-DT,PDTB),并结合汉语领域语料的特点,提出一套较易于标注操作的篇章标注体系。这套体系从内容、关系、指代三方面描绘了篇章内部的深层结构与含义。为了便于研究人员开展标注,并保持标注的一致性,本工作独立设计并开发了全新的篇章标注平台。通过这个平台,研究人员可以对篇章进行分段分句、内容标注、关系标注和指代标注,标注过程和结果都能准确、直观地显现。利用篇章标注平台在医学领域语料上尝试人工标注,构建了医学篇章标注语料库。对人工篇章标注结果的分析表明了所提出的标注体系同时兼顾了篇章内容的表示和可操作性。同时,本文将标注结果用于医学领域问答,验证了篇章体系设计的合理性。
其他文献
该论文阐述了Microsoft.NET环境的体系结构和建立在此基础之上的电子商务开发技术,使用全新的面向对象语言C#,结合ASP.NET,运用Web服务,设计和实现了基于图书零售业的电子商务
面向学术文献的信息推荐技术具有很好的实用性,能帮助研究人员减轻信息过载所带来的负担。根据美国科学基金预测,2014年全球发表的论文将达到一百六十四万篇。面向学术文献的信
随着计算机技术的不断成熟和迅猛发展,我们使用普通的PC机就可以实现以前只有在高端的图形、图像工作站才具有的图形、图像处理功能。广大医疗机构对低成本、功能更全面的医学
该文分析了计算机远程控制的实际意义以及发展方向,阐述了用于支持远程控制技术的基本原理和实施手段,从应用方面,介绍了远程技术的功能、实现手段以及辅助的安全问题.针对远
本文的工作是为国家973课题“领域特定的虚拟计算环境”设计开发分布式并行计算平台UNIAS的Web管理工具。分布式并行计算平台在近年来迅速发展,已经逐步由封闭局域网环境下、
该文通过对面元图形学技术和体元图形学技术的研究,提出了基于规则子块体数据的体元造型技术,并将其应用于三维地质体建模软件系统.基于体元的地质块体模型能充分表示地质构
在入侵检测系统中运用代理技术特别是移动代理技术是一个很好的研究方向.在一般的基于代理入侵检测系统中,移动代理的应用主要是检测以及信息采集.该文首先提出一个基于移动
该文针对应用于版权保护的鲁棒数字图像公开水印技术做了一些研究,主要包括以下三个方面的内容.1、提出了一种新的图像空域自适应公开水印算法:算法通过结合人类系统HVS(Huma
光谱分析技术由于具有操作简便、能实现多元素或化合物的同时测定以及灵敏度高等优点,已被成功应用于农业和食品等众多领域。单模型建模是光谱分析中常用的一种手段,即通过训
随着信息技术,特别是网络技术的迅速发展和普及,大型应用系统由集中式发展为分布式,软件生命周期越来越短,新的需求和个性化需要越来越多.客户对软件开发周期的要求越来越短,