上下文边界可变的贝叶斯分类器词义消歧方法

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户:flyinsky_zxt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
词义消歧在自然语言处理中具有重要作用,而基于贝叶斯分类器的的方法是一种较为常见的词义消歧方法。本文针对基于贝叶斯分类器词义消歧方法所需的特征的上下文边界进行探究,提出在训练过程中对特定多义词给出在训练中使该词的词义消歧效果最优的上下文边界,即上下文边界可变的贝叶斯分类器词义消歧方法,通过实验证明该种方法对词义消歧正确率有一定的提高。
其他文献
本文根据目前已有的方位词研究成果以及已构建的现代汉语方位词用法词典和用法规则库,初步完成了对现代汉语方位词例句语料库的基于规则的用法自动识别,通过对自动识别结果的分
连词能够连接词语、句子乃至篇章,具有特殊的连接功能,用法复杂多样。目前已有的连词研究成果大都是面向人用的,对连词用法的描述难以避免主观性和模糊性,很难直接应用
会议
排丽旦是个美丽的女子,见过她的人都会这么看;排丽旦也是一个优秀的女人,和她相处过的人都会这么想。维吾尔族女子排丽旦·艾拜都拉在家乡新疆克孜勒苏电视大学教师的岗位上,勤勤恳恳、兢兢业业耕耘了十年,做起了沟通汉语与维语的桥梁。
本文基于TCRF(tree structured conditional random field)模型对汉语框架网(CFN)中的核心框架元素进行了自动标注研究。该方法抽取了依存树中父节点层而的特征,使得
会议
特征选取是用统计方法进行词义排歧的关键。本文通过句法块的分析结果,将主语和宾语、以及主语和宾语在知网中的归类信息应用于目标动词的词义排歧。实验表明,句法特征对于目标
本文提出一种基于层叠条件随机场的统汁和规则相结合的句法成分中心词自动识别的方法。首先将输入的—个标有句法成分的句子分为底层组块和高层短语,分别对这两部分训练两个不
基于规则的现代汉语方位词的用法标注有助于文本内容的自动理解,由于人工制定的规则具有不完备性,为了提高准确率,往往需要人为考察错误标注语料来完善方位词的用法规则,这是费时
本文利用概率潜在语义分析,给出了两种用于判别词汇的情感倾向的方法。一种是使用概率潜在语义分析获得每个目标词和基准词之间的相似度矩阵,再利用投票法决定每个目标词的情感
5月份,我国经济运行继续呈现回升向好势头,钢铁生产继续保持较高增长,需求也保持较高水平,但由于国家房地产等宏观政策调控影响,市场出现恐慌,预期信心下降,影响国内市场钢材
期刊
语义角色标注的研究方法中使用最频繁的一类是基于特征工程,将任务转化成分类问题使用机器学习的方法来解决,而且几乎所有的有指导语义角色标注采用的标注语料都是宾州大学命题