论文部分内容阅读
本文以现代汉语(特别是网络搜索词)中的名名组合的语义关系为主要研究对象。名名组合内部的语义关系复杂,常常隐含了谓词。对名名组合进行释义的主要目的是发现两个名词之间隐含的谓词,进而揭示这两个名词之间的语义关系。本文在生成词库论等理论的指导下,提出了一种自上而下与自下而上相结合的方法,设计并实现了自动生成由两个名词构成的名名组合的释义短语的程序。本文首先搜集、分析了谷歌热榜词和百度新闻热搜词,发现名名组合在网络搜索词中占有重要地位,研究名名组合的自动释义对信息检索等自然语言处理应用有所帮助;然后本文借鉴生成词库论,结合《现代汉语语义词典》,对来自百度新闻热搜词、前人文献和各种小说、散文中的850个名名组合进行了归纳,总结得出了356个语义类组合模式及其相应的释义模板,在此基础上建立了名名搭配数据库Noun_Noun;接着,本文利用《知网》资源,进一步建立了名词知识库Noun_Verb;最后,本文在名名搭配数据库Noun_Noun和名词知识库Noun_Verb的基础上,进一步开发了汉语名名组合的自动释义程序。我们设计的自动生成名名组合释义短语的程序,主要有5个操作步骤:(1)对于输入的名名组合首先进行切词、标注词性操作,得到词串N1+N2,确定为名名组合;(2)分别查询N1和N2在数据库Noun_Verb中的语义类S1和S2;(3)在数据库Noun_Noun中查找语义类组合模式为S1+S2的释义模板;(4)根据释义模板的要求在数据库Noun_Verb中查找相关名词的施成角色或者功能角色(动词),作为表示N1和N2之间的语义关系的谓词;(5)将动词、N1、N2插入至释义模板中,生成释义短语。在程序建立以后,我们以2011年5月至9月的百度新闻热搜词中的名名组合作为测试数据,检验了程序的有效性。通过研究和程序测试,本文还为《现代汉语语义词典》和《知网》提出了一些改进意见和建议。本文希望能够实现语言资源和应用系统的良性互动,同时,通过开发名名组合自动释义程序,本文深感建设基础语言资源的必要性和重要性。在国内,关于汉语名名组合自动释义的研究,比较具有代表性的是王萌、黄居仁、俞士汶、李斌(2010)。跟王萌等(2010)的研究相比,本文具有3个特点:(1)释义模板更为丰富;(2)释义短语更为自然;(3)多种方法有机结合。跟王萌等(2010)的研究相比,本文的不足之处是:(1)我们的研究成果在很大程度上依赖于人工建构的释义模板和相关的知识库,操作的步骤比较多,没有王萌等(2010)的系统智能;(2)我们归纳的释义模板、名词的施成角色以及功能角色还不够完善,还需要在使用过程中不断扩充和改进。本文还提出了一些进一步改进名名组合自动释义程序的设想。我们期望,在进一步完善名名组合自动释义程序之后,它能够更好地为搜索引擎、机器翻译等自然语言处理任务服务。