基于数据库语义学的古汉语句法语义分析研究

被引量 : 3次 | 上传用户:tianyawoaiai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文自然语言处理多以现代汉语为研究对象,但古汉语作为中国传统文化的重要载体,其自动句法和语义分析研究对于中国传统文化的西传具有重要意义。关于古汉语的自动句法和语义分析研究也会促进现代汉语自动分析的发展和进步。现代汉语的自动句法和语义分析取得了很大进步,但当前通用语法和句法分析器在应用于古汉语句法分析和语义表示时存在一定不足。本文以数据库语义学为理论框架,以其重要组成部分-—结合语法为技术支持,基于时间线性原则和描述性原则,以《左传》及其英译本为语料来分析古汉语的基本句法和语义关系。本文的研究工作主要分为如下几个方面:第一,根据数据库语义学句法分析的具体要求,以《左传》及其英译本为语料来源,建立一部双语词典。词条的存储形式为“命题粒”,“命题粒”是一种非递归特征结构,是一个属性值对的集合。词的语法信息和语义信息分别作为其特征结构中相应属性的值进行详细标注,满足基于数据库语义学和左结合语法句法语义分析需要的同时,从词的层次上降低由一词多义和词类活用引起的歧义发生率。第二,从自然语言处理的角度出发,对《左传》的语法特点、句式结构重新进行梳理,并结合基于左结合语法的自动句法分析的需要,总结归纳基本句法规则,从名词、动词、形容词三大词类的基本用法出发,研究和分析了主谓结构、联合结构、动宾结构等基本结构,以及宾语前置、语义被动、形式被动和成分省略等基本结构的变体形式。第三,在虚词处理方面,提出有条件移植法。在实词吸收虚词的过程中,有条件保留虚词的核心属性值和/或语义属性值。这和数据库语义学原来的处理方法不同,能够避免语言生成和机器翻译过程中可能出现的大量回溯。第四,在句法分析过程中透过表层结构挖掘语言内容,分析深层次的语义关系和语用内涵,通过规则操作的方法为词的语义属性添加新值,以表现其施事、受事、历事、修辞、被动等语义角色和语用功能。我们期待基于改进的数据库语义学的自动句法语义分析方法能够在今后应用于其他大规模语料的研究和分析上,比如和《左传》生成年代不同且具有不同语法特征的古汉语文本。另外,基于本文研究基础上的语言生成和机器翻译也是我们后续研究的方向之一。
其他文献
<正> 随着中国加入WTO,开放电信市场势在必然,海外移动通信运营商对中国大市场虎视眈眈已久。国内的电信业改组进行得如火如荼,竞争对手迅速成长。虽然目前我们的网络规模在
会议
通过引进荷兰四季菊美宏丽、庆回归、巴美白、四变菊4个品种进行种植并观察对比其生物学特性,发现4个品种中四变菊这一品种在建阳区具有较强的适应性,各项生物特性表现良好,
首先概述了质量监督机构的主要职责,然后详细阐述了交通工程质量安全监督中存在的主要问题,主要包括:项目管理难度大、管理力量弱化、设计方案不完善、施工队伍素质不高、监
2013年12月10日,园林植物专业委员会第四次会议在深圳中国科学院仙湖植物园召开,主题为“生态文明背景下的园林植物研究与创新”。会议由深圳中国科学院仙湖植物园、深圳市北
随着全球气候变暖、世界自然环境日益变坏,人们开始逐渐关注低碳生活和低碳消费。低碳消费模式作为一种新的消费模式,在为企业带来契机的同时也会带来技术革新的挑战;而对于政
在高度现代性的社会之中,个体日益从传统中“溢出”,并通过自我的反思性逐步地习得规则和资源的应用,两性间的互动方式也因此面临着前所未有的转型和更新。在此语境下,女大学
行政复议决定书是复议机关联系社会公众的重要窗口,也是体现复议机关行政能力的主要载体.目前行政复议决定书说理性的明显不足,已经严重影响到社会公众对复议机关的信任,影响
针对鸭巴氏杆菌病的临床症状、诊断方式进行分析。患病鸭多具有精神萎靡不振、呼吸困难以及腹泻等症状。在明确其体征与变化特点的基础上,提出有效的防治对策,发挥科学预防、
机器是否能够有理解能力这个根本问题是人工智能哲学讨论的核心问题之一。AI中的理解可分为弱理解和强理解:弱理解是AI通过含有人类认知能力的程序所实现的理解;强理解是赛尔
本文就韩国现代生活陶艺的特征进行研究,运用文献研究法、资料收集法、分类归纳法和图片分析法,阐述了韩国现代生活陶艺在工艺、形态、装饰三个方面表现出的特征。韩国现代生活