非句蜕广义对象语义块构成的分析与处理

来源 :中国科学院声学研究所 | 被引量 : 0次 | 上传用户:ioryfei913
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文研究汉语非句蜕广义对象语义块的构成。本文的研究源于对汉语句类分析研究的深入。句类分析的策略是从语义块感知入手,先句类假设检验,后语义块构成处理。当前句类分析的研究中,全局特征语义块的感知规则,特别是动词连见的处理研究,都已经取得了丰硕的研究成果。然而在广义对象语义块(简称GBK)这一方面,系统的研究还需加强。与语句构成知识的阐释相比,语义块构成知识的阐述还不够系统和成熟。在句类分析平台中,语义块构成处理是最薄弱的环节,一方面是因为还没有实际处理到语义块构成阶段,另一方面语义块构成处理中存在许多有待解决的难点。 语义块构成处理是句类分析三部曲的重要一环,广义对象语义块分为非句蜕GBK和句蜕GBK两种形式。非句蜕GBK主要是由一些体词以及体词化的动词组成的联合体,对应于语言空间中为词和词组的情形。非句蜕GBK是构成整个GBK体系的基础。本文将非句蜕GBK的基本组合关系分为并列、修饰和名词团块三种,在研究中引入区分度的概念,探索了非句蜕GBK各成分优先组合和语序排列的规律,提供了从局部对语义块进行构成分析的线索,并结合句类知识加以检验。然后还研究了专有名词的构成以及广义对象语义块的边界切分,完善了对广义对象语义块的研究。 在研究方法上,引入了一个封闭语义块内部的区分度递减模型,着重分析非句蜕GBK构成的表现形式和规律,结合每一种非句蜕GBK基本组合关系的内容,通过对真实文本中的语料进行分析,总结归纳出非句蜕GBK处理的规律和具体规则,并在一定规模的语料中进行了验证。对语言现象的描述重在归纳和统计,理论探索部分以分析为主,在对语言现象的统计和语言学的理论阐释基础上提取出规则。 在HNC理论已有研究的基础上,本文开展了相关的研究工作,主要贡献和创新点如下: 1、首次对非句蜕广义对象语义块的构成进行了系统的研究。非句蜕GBK是构成整个GBK体系的基石,其研究意义不言而喻。文中提出了非句蜕GBK的三种基本组合方式,详细论述了各自构成的特点和规律。指出在语言中绝大多数非句蜕GBK都含有组合关系,多数情况下为这三种组合关系的复合。三种组合关系的识别主要依据构成语义块的词汇的概念类别和HNC概念表达式,并且需要结合句类知识来进行。 2、通过对非句蜕GBK三种基本组合方式的构成研究,发现其优先组合和语序受概念区分度大小的制约,提出了在一个封闭的非句蜕GBK内的区分度递减通则,认为非句蜕GBK内部各成分的区分度是一个递减序列,并且区分度差值越小的概念越优先组合。还推演出概念之间组合时概念优先组合和语序的规则,提出了利用区分度的比较来进行识别的策略。 3、对GBK边界切分问题进行了全面的研究并提出了初步解决方案。根据与GBK邻接的语义块类型,将GBK边界切分问题分为GBK-GBK型,GBK-EK型,GBK-fK型三类。GBK的边界切分处理是将句类知识和区分度递减通则结合起来使用的,体现出全局联想脉络和局部联想脉络的有机结合。 4、研究了专有名词的概念和分类,认为专有名词和普通名词的最大区别在于前者带有特定的命名部分。通过在语料中的分析,得出专有名词的基本结构为:专有命名词+领域概念词+通名,同样满足区分度递减通则。因此将区分度作为识别专有名词的一个线索。 综上所述,本文系统研究了非句蜕GBK的构成,包括三种基本组合关系、专有名词处理以及GBK边界的切分,并提出了相应的处理策略。本文研究深化了句类分析系统中语义块构成处理的探索,为提高扩展句类分析平台综合处理能力提供了基础。
其他文献
建立高性能通用卫星地面预处理系统是未来对地观测领域发展的一个重要环节。本文以中国DMC+4(又名Beijing-1号)小卫星地面预处理系统的研究与开发为基础,结合小卫星系统特点,分
随着通信技术和网络技术的飞速发展,人类对信息传输的速率和质量提出了更高、更新的要求,致使计算机与通信两个领域之间的相互联系、渗透和依赖日益深入,由此促进了计算机网络功
包裹着DNA的组蛋白上存在着诸多酶促修饰,对基因表达起着重要调控作用。本部分研究在对人类肝癌的肿瘤和癌旁组织样品的组蛋白进行非限定性修饰分析时,发现相对分子质量+42的
RFID作为当今一种热门的自动识别技术,有着巨大的发展潜力。与被动式RFID相比,主动式RFID在识别距离等方面有着诸多优势,但是主动式RFID存在着多卡同时识别产生的碰撞问题和功耗
该文提出了由GPS、GLONASS、Galileo和区域覆盖卫星定位系统互相辅助的设计思想,并且重点研究了多种卫星导航定位系统共用的几个关键技术:第一,各种卫星定位系统的特性研究.
煤矿地下开采及其它的地下建筑需要灵活、安全的应急通信系统,而这种非寻常的通信应该采用透地无线通信方式,只有这种通信方式才能满足地面到地下有限空间对安全通信的要求,因此
近年來,军用战术电台发展的一个明显趋势是从单频段、单用途电台向多频段、多方式系统发展。拓宽现有频段、发展多频段除了有利于协同通信和全频谱作战以外,也提高了通信装备
石斑鱼隶属鮨科(Serranidae)、石斑鱼亚科(Epinephelinae),为广泛分布于热带和亚热带海域、暖水性礁栖的名贵海产鱼类。过度捕捞和栖息地破坏,使石斑鱼自然资源出现衰退迹象。
本文通过对荣华二采区10
期刊
通过对混沌序列的分析研究发现,单一映射产生的混沌序列具有复杂度低,容易通过反向逆推估计出系统的缺点。本文以Tent序列和Logistic序列为基础,利用嵌入法构造了一个新序列。该