中文词汇语义关系抽取及应用研究

来源 :南京师范大学 | 被引量 : 0次 | 上传用户:qqwc112
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词汇语义关系是指在语义范围内建立起来的词汇间的逻辑关系,主要包括同义关系和上下位关系等。词汇语义关系资源属于自然语言处理的基础性资源,在文本分类、问答系统、信息检索等领域都有广泛的应用。本文主要研究中文同义词和上下位词的抽取。主要工作包括:(1)同义词抽取。利用基于语义词典、网络资源和模式的方法抽取同义词。同义词抽取的微平均和宏平均的F值最高达到53.54%和49.29%,分别比NLP&CC2012评测的最高结果高12.54%和9.61%。因此利用基于语义词典、网络资源和模式的方法抽取同义词,共抽取出11万拥有同义词的词条集合,构建了一个较大规模的同义词知识库。(2)上下位词抽取。利用基于语义词典、网络资源和模式的方法抽取下位词。下位词抽取的微平均和宏平均的F值较低,召回率较高,分别为58.6%和63.1%,比NLP&CC2012评测的最高结果分别高8.27%和3.16%。利用基于语义词典、网络资源和模式的方法抽取下位词,共抽取出9万拥有下位词的词条集合,构建了一个较大规模的下位词知识库。(3)词汇语义关系的应用。本文将构建的语义知识库应用到文本分类中,并尝试为《现代汉语语法信息词典》的名词构建语义词典。首先分别将语义知识库和《同义词词林(扩展版)》加入文本分类中,《同义词词林(扩展版)》准确率最高为92.99%,本知识库的最高准确率为94.1%,提高了1.11%。根据语义知识库为《现代汉语语法信息词典》的名词抽取语义关系,为抽取的同义词关系进行人工校对,构建一个准确的同义词语义关系词典,并将其应用到文本分类中,取得令人满意的效果。
其他文献
<正> 近年来,笔者用键针疗法配合血府逐瘀汤加减治疗三叉神经痛16例,取得一定疗效,现报道如下:临床资料(一)本组16例中,男性6例;女性10例;年龄在30~60岁;病程5~30年。(二)疼痛
互联网时代,跨境电商为我国中小型外贸企业带来了新的发展契机。本文在分析中小外贸企业发展跨境电商面临的困难和存在的问题基础上,提出了中小外贸企业发展跨境电商的对策建
本文通过对四川浓香型白酒的品质优势剖析,提出了以四川系列功能调味酒替代四川普通原酒是川酒在全国范围内大流通的发展通趋势,进而展望了四川功能调味酒的研发思路及其应用
<正>1中小学图书馆馆员应具备的基本素养中小学图书馆员的基本素养主要包括文化素质、职业精神与信息能力三部分。图书馆从事着具有悠久历史的信息服务活动,而传统的信息服务
雷电灾害是我国重大灾难之一,它给人民群众的财产或者公共设施带来了一定的危害。在此基础上,我国在对待雷电防护方面花费了重大财力与精力。本文就雷电防护降低接地电阻进行
选用物种丰富度 (S)、Shannon Wiener多样性指数 (H′)、Pielou均匀度 (E)和优势度曲线 (K dom inance)等指标 ,对安徽大别山区虫生真菌群落多样性进行了测定 .结果表明 ,群
自然拼读是一种在英语母语国家非常流行的教学方法。而中国学生通常从音标开始学习英语,很多学生认为音标难度太大,也正因此对英语失去了兴趣。近年来,中国一些发达地区的少
目的:探讨髋臼骨折手术治疗方法和效果.方法:2001年1月至2006年12月手术治疗髋臼骨折59例.所有骨折按Letournel-Judet的方法分型,其中后壁骨折20例,后柱骨折5例,前柱骨折6例,横
目的:研究呼吸功(WOB)对机械通气患者撤机的指导意义。方法:选择机械通气并准备撤机的患者23例,应用BICORECP100呼吸监测仪床边监测患者WOB及常规撤机指标〔呼吸频率(RR)、潮气量(VT)、每分通气量(VE)和最大用力吸