藏语依存树库的构建

来源 :青海师范大学 | 被引量 : 0次 | 上传用户:lan737898
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法分析是整个自然语言处理过程中很重要的一个环节,在句法分析领域,人们一般采用树库作为获得句法知识和评价句法分析器性能的资源。藏语依存树库构建技术可以为基于统计的藏语自动句法分析器提供必要的训练数据和统一的测评平台,而且能为藏语句法学研究者提供真实的文本标注素材,便于语言学家从中总结语言规律,也是进一步进行句子内部的词语义项和语义关系标注的基础。  藏语依存树库的构建不但是藏文信息处理领域的一项很重要的研究工作,也是自然语言处理研究中的关键技术之一,通过构建藏语依存树库可以为藏文信息处理、藏语语言研究和藏语语料库语言学等研究领域提供重要的语言数据资源和研究平台,对推动藏文信息处理研究具有重要的意义。  本文通过收集整理1000句藏语分词标注语料,进行了藏语依存树库构建技术和方法的研究;介绍了依存语法的基本概念、依存关系解析、藏语句法分析引入依存语法的目的等;制定了藏语依存句法标注规范和标记,大类为5种,小类为36种;通过依存树库构建方法的研究,设计实现了藏语依存句法标注工具;对藏语依存句法树进行了较为详尽的分析;以藏语依存句法标注规范作为依存关系的标注依据,利用藏语依存句法标注工具作为辅助软件建立了规模为1000句、词语总数为11951个、平均句长为12个词的藏语依存树库;并对建立的藏语依存树库进行了词类分布统计。
其他文献
本文阐述了智能教学的基本理念及发展现状,指出了目前智能教学建设中存在的主要问题。从智能教学的实际要求出发,以面向对象设计思想和对象/关系映射理论为基础,设计了一个以知识
设备故障诊断是一门各学科交叉的新技术,近20多年来,得到了迅速发展,并产生了巨大的经济效益。信息融合是近年来兴起的一门学科,在许多领域得到了广泛的研究和应用,在设备故障诊断
在信息融合系统中,从不同层次和不同角度采集的多源信息在系统中表现为信息的冗余性和互补性,进而导致了融合过程中信息间的冲突与合作,如何解决多源信息冲突环境下的信息融
利用海量的非结构化数据如Web文本构建知识库,已经成为近年来自然语言处理与机器学习领域的热门研究课题。自动知识库构建需要概念抽取和语义关系抽取两方面工作,概念提取旨
关于运动中物体的速度测量一直是被人们广泛研究的课题。随着时代的发展科研技术水平的不断提高,利用各种不同的速度测量方法制作的速度测量装置不断涌现,如,航速计、车速计、流
数字视频处理在工业、军事和民用等领域发挥着重要的作用,而旧的视频处理标准已经不能满足日益增长的市场需求,所以出现了以MPEG-4为代表的新一代标准。新的标准带来新的应用
本课题开发了一套锅炉仿真培训系统,目的是借助该仿真系统,提高燃油锅炉操作培训的效率和质量,并对操作人员的技术水平和熟练程度进行公正、准确的量化考核.本论文全面介绍了
  论文课题针对异种网络切换的情况,创新地提出一种流媒体自适应方案,即通过扩展RTCP协议的移动性,使其在切换后立即向业务源端发送网络情况监测报文,从而使业务源端在切换后及
随着电力系统的规模不断扩大,对用电稳定性和可靠性的要求越来越高。配电网是直接向用户供电的网络,而变电站是配电网最重要的组成部分,提高变电站的自动化水平具有非常重要的经济效益和社会效益。目前国内变电站自动化监控系统传输规约的使用较为混乱,由此引发的规约转换问题已成为实际工程中的最大问题。本文将OPC(OLE for Process Control)技术引入到变电站综合自动化监控系统来解决变电站自动化
当前分布式对象技术的发展,为开发高性能、可扩展的、安全的分布式企业应用程序提供基础。在复杂的分布式环境中,应用软件结构复杂,涉及多种技术,对设计开发人员提出了很高的