论文部分内容阅读
本文分析了目前自然语言理解的现状,并对现代汉语自然语言理解的语义问题进行了研究。目前现代汉语语义理解问题的研究主要表现在:汉语自然语言的语义理解一直是根据印欧语系比较研究的思路,而为计算机所建立的汉语语义理解的理论基础大都是印欧语系(主要是指英语)的理论,但汉语与印欧语系存在着根本性的区别,因而对应的语义理论也就存在着对汉语自然语言的语义理解难以有较好的解释力,这样对应于汉语在计算机上的形式化语义理解也就难以做出符合汉语自身特点的解释,其语义理论也就不适合于汉语自然语言的理解,即改进的印欧语系的语义理论是不能适应于汉语自然语言理解的。对此本文提出为计算机建立一个符合汉语自身特点的现代汉语自然语言理解的新理论体系---性质语意。 “性质语意”认为汉语的语义对应着深层结构的语义和表层结构的语义,汉语深层结构的语义对应于性质语意下的语意指向,该语意指向决定着句中的主题概念,决定着相关的主体和客体的关系;而一个汉语句子是由一个或多个或无数多个主体和客体所构成的语义关系组合;汉语表层结构的语义,又对应着性质语意下的语义指向,也决定着句子的相关形式表达,决定着相关的主体、客体以及与它们之间的语义指向关系的语义关系;对此就可建立汉语句子的语义结构形式表达:[主体+客体]{[语义指向关系]}{语意指向};句子语义=性质语意=性质语意的语意指向+性质语意的语义指向=第一客体 =>{主体语义+客体语义}[语义指向]{语意指向} =>{主体[义素分解]{意素分解}+[客体[义素分解]{意素分解}]}; 客体[义素分解]{意素分解}=>{主体[义素分解]{意素分解}+[客体[义素分解]{意素分解}]}; =>{主体[+Y_N]{[+S_M{+P_T}]}+[客体][+Y_N]{[+S_M{+P_T}]}} 客体[+Y_N]{[+S_M{+P_T}]}=>{主体[+Y_N]{[+S_M{+P_T}]}+[客体[+Y_N]{[+S_M{+P_T}]]} [+Y_N]:Y是语言形式表达(Word)_i的义素分解,{[+S_M{+P_T}]}:S是主题概念的义素分解,P是对S的意素分解;N,M,T→0,1,…,n;主题概念:{+P_T}[+S_M] 主体与客体的划分是一对相对概念,是相对句子的语义指向关系而确定的;语义指向是关于人与物之间的语义关系,人就是主体,物就是客体;语义指向关系是关于物与物之间的语义关系,相对于人而言,这物仍然是客体,也就是客体与客体之间的语义关系,如果客体之间存在着语义指向的语义关系,那么语义指向的语义关系的前向的客体是后向客体的主体。并总结了相关的十大词类并分别一一对应为相关的主、客体和语义指向关系。 一个确切的形式表达式,对应于计算机的理解,应该体现出性质语意的内涵与外延的概念,该概念体现为语意指向的内涵:种与属的概念;种是句子的主题概念,属是句子主题概念下的附属概念;而引入层与主的语义指向外延的概念,是要进一步对种和属进行更加明晰和清楚的形式化分析;层是指语义的层次性,一层是相对于一个语义指向关系下的一对主客体;主是非相关相对的主客体语义成分之间的主体概念,在此之下还延伸了词汇相关义素属性下相对主概念的义概念,以“义”相关分析进行汉语句子语义属性集成。对于相关歧义问题的研究更是体现出主概念下进行义概念的分析。 随后,根据本文提出的性质语意理论又对汉语语义歧义六个方面的问题进行了统一形式毕一州匀贡语念的目然语。;理解及共实现的胡儿化语义分析的研究。 任何一个汉语句子的语义都可以归结为性质语意命题的研究,其研究又可以对应为自然语言的交际性下的推理问题,即语言交际者的命题态度,主观意向卜的主观态度,即是研究性质语意命题的真假判断,研究语意指向下的语义指向的真假判断,该真假判断是显前提的语义关系形式、隐前提的语义关系形式与语义指向的语义关系形式,以及它们之间的语义指向关系的形式比较判断,根据此判断:1可保证语义有意义的句子进行求解;2可判断句子对话中无用的废话。这样就可为计算机建立一个语义判断的逻辑真值。 在实际应用方面,建立了字字对应的基于性质语意的词汇切分法以及基于性质语意的短语和句子语义合成法。根据本文以上理论建立了相关的计算机实验系统。 本文的研究工作,是跨中文信息处理和现代汉语语义两个领域进行的。一方面,研究的具体结果对推进中文信息处理技术的发展有直接的应用和参考价值;另一方面,从中文信息处理的角度来审视现代汉语语义结构的研究,可以为研究工作提供一个清晰的实用背景。不仅可以注意到以往面向人的研究不容易注意到的一些问题,而且也使得语义形式化研究中的许多问题能够在一个形式化系统的框架中得到更明确、更规范的表述。