基于词典的半指导学习古汉语全文词义标注

来源 :第十一届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:iorikof1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧是自然语言处理中的一项基础任务.本文针对先秦古汉语这一特殊的语言材料,将WSD的过程分为先区分拼音后区分具体词义这两个步骤.实验过程使用了《汉语大词典2.0》为知识来源,《左传》为语料,采用了基于支持向量机(SVM)的半指导方法.本文同时做了直接为全体词义分类的对比实验,结果证明"分两步走"的标注过程确实更充分的利用了词汇的语言学信息,达到的效果也更好。
其他文献
为全面掌握煤炭大数据研究及应用现状,为今后煤炭大数据的研发和应用提供帮助,研究了煤炭大数据应用现状.把目前煤炭大数据应用分为生产过程的安全预测预警、工艺参数优化和
从煤矿日常的安全管理实践入手,分析煤矿安全管理中单岗作业、习惯性违章、特殊时间的安全管理、隐患管理、变化管理、安全培训、应急管理等7个容易被忽视的盲区,并针对这些
关于天津这名字的来源,得追溯到明朝那时候。话说明朝开国皇帝朱元璋登基后,将他的儿子们分封为王,驻守在全国各地。其四子朱棣被封为燕王,驻守于北平,就是现在的北京。朱元
隐喻的计算语言学研究主要存在两个问题:隐喻理论多样且差异较大;隐喻知识库和语料库的可计算性不足.为解决隐喻理论与计算的衔接,寻找面向计算的隐喻分析框架,本文提出了利
为探究工作负荷与矿工不安全行为之间的关系,以资源保存理论和社会交换理论为基础,构建了以情绪耗竭为中介变量,组织支持感为调节变量的理论模型,根据对煤矿企业的286份调查
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
期刊
今年元宵节,福建龙岩举办了第十一届冠豸山客家民俗文化节。文化节活动内容丰富,有开幕式客家文艺表演、海峡客家专题民俗游活动、全国画报社大型摄影采风等活动,其中连城县
针对煤矿隐患类别与事故类型进行规律研究,利用数值分析功能,拟合隐患与事故的相关性.研究表明:治理好煤矿“较大隐患+安全管理隐患”对预防和减少煤矿事故发生起决定性作用;
文本蕴含问题是指给定文本与假设对,判断文本和假设之间的关系,是证实、证伪还是未知.本文介绍了一个利用词汇知识库(如北京大学的中文概念词典CCD)、概率计算模型等判断文本
建构大规模的汉语语义资源,是当前中文信息处理的重要任务之一.但是其中语义分析的传统方法存在一些问题,不能很好地反映汉语中各个词语或成分之间的语义关联.本文提出了基于