最大熵分类器相关论文
作文自动评分系统是应用计算机技术对英文作文进行评分的系统。作文自动评分系统综合应用了统计学、自然语言处理、语言学及信息检......
针对监督机器学习方法抽取实体关系受限于标注语料的规模问题,提出采用信息熵方法来不断扩展小规模训练数据的半监督领域实体关系......
基于统计机器学习的语义角色标注在自然语言处理领域越来越受到重视,丰富多样的特征直接决定语义角色标注系统的性能。本文针对中文......
指代消解是自然语言处理中的一个重要问题,包括专有名词、普通名词、代词的指代识别。本文实现了一个基于机器学习的英语名词短语......
该文旨在研究中文在线评论的用户性别判定问题,即根据用户的商品评论识别用户的性别.首先研究了在线评论中对用户性别起指示作用的......
谓词是句子中的最重要的成分,它的正确与否对语义分析的影响非常大。而众多的特征直接影响到谓词标识的性能,如何组织这些特征显得......
该文通过深入分析术语的语言学特点和领域特点,引入了能充分刻画术语译文流利度、紧密度和忠实度的三类特征,即术语构词、互信息和......
抽取了3种典型的单词后验概率特征(基于固定位置的词后验概率、基于目标位置窗的词后验概率、基于词对齐的词后验概率)和3种语言学特......
特征决定着语义角色标注的性能,但并非特征越多性能越高。因此,如何优化组合这些特征就显得非常重要。选取了当前语义角色标注系统......
现有中文语义角色标注主要集中在基于短语结构句法树的标注。基于此,提出一种基于依存树的中文语义角色标注方法。将中文句子转化为......
冗余现象是口语对话中普遍存在的特殊语言现象之一,它的存在常常会影响口语句子的理解和翻译。该文基于真实口语对话语料对冗余现......
依存句法是句法分析的一种,相比于短语结构句法分析,依存句法具有更简洁的表达方式。该文采用英文语义角色标注的研究方法,实现了......
该文通过深入分析术语的语言学特点和领域特点,引入了能充分刻画术语译文流利度、紧密度和忠实度的三类特征,即术语构词、互信息和......
篇章关系分为显式和隐式两种。显式关系的显著特征是篇章的基本单元之间存在显式连接词。针对汉语显式篇章关系,构建了包括汉语连......
语义角色标注是浅层语义分析的一种可行方案.描述了一个采用最大熵分类器的语义角色标注系统,该系统把句法成分作为语义标注的基本......
首先介绍3种典型的用于翻译错误检测和分类的单词后验概率特征,即基于固定位置的词后验概率、基于滑动窗的词后验概率和基于词对齐......