一种无指导的词义排歧模型

来源 :全国第五届计算机语言联合学术会议 | 被引量 : 0次 | 上传用户:garry0809
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
该文提出了一种基于结构语义空间的词义排歧模型。模型在一个大规模语料库上统计并抽取任一同义词集中那些单义词前后同现的实词皮些来构造《同义词词林》中义类代码的“分类器”。由于这种词义排歧知识的学习采用的是无指导学习方法,从而可以免除对语料库实行词义人工标注的大量开支。实验表明,这种词义排歧模型具有较高的排歧确率,而且对不同领域的文本具有较好的可移植性。
其他文献
近年来许多研究单位推出中文标准语料库,如新加坡国立大学的PH语料库,中央研究院的平衡语料库1.0版及2.0版,除可以提供自然语言处理研究所需的训练及测试资料,帮助建立语料训式的中文语言
该文简要地介绍了语言中广泛存在的模糊现象,并从多种模型的角度加以分析,特别讨论了语文模糊的处理方法,文末给出一个正在实现的自然语言理解系统的结构。
SRD是一个根据JFY—4机器翻译规则系统的设计原理和算法构造的规则描述专用语言,它为JFY—4系统提供了一种语言规则与程序分开的设计方式。该文介绍了构造SRD的出发点;SRD的描
本文提出了步行机器人运动控制算法。该方法以相对运动学原理为基础,把机体的运动规划问题转化为腿的足端轨迹规划问题,从而使步行机器人运动控制问题得到大大简化.并应用该
线性预测编码(简称LPC)是近代语音分析与合成中最有效的技术之一。该文讨论LPC的基本原理,并介绍TMS5100及语音音素合成片的情况,以及用其合成汉语语音的方法,给出部分实验结果。(
会议
技术的进步使汉语无限词汇合成成为现实,为达到文语转换系统高音质的要求,合成言语的自然度成为突出的问题。为此用实验方法研究音段特征和超音段特征对合成言语自然度的影响。
日前,匈牙利科学家在分析“火星全球勘探者”拍摄的照片后,宣称在火星南极有活的生物体存在,其生存类型类似地球南极附近生物.匈牙利的科学家小组表示,照片显示在火星冰雪覆
汉语同西方语言的明显区别在于它没有变格,即没有词形变化来表明一个名词是属于什么时态。可是没有汉语语法却未源于西方。1898年间问世的“马氏文通”是我国第一部汉语语法