汉语词性标注相关论文
汉语词性标注是中文信息处理技术中的一项基础性课题。一方面,它的研究成果可以直接融入到信息抽取、信息检索、机器翻译等诸多实际......
随着信息技术和网络技术的不断进步与发展,计算机成为了人类生活必不可少的一种工具。由计算机智能地处理人类语言的技术,即自然语......
在汉语语料库语言学研究中,基于词的研究取得了令人满意的成果,如中国科学院张华群的ITCLAS汉语词性标注.英语单词之间有空格,分词......
中文信息处理,早已由字一级提升到词一级,于是分词,词性标注愈来愈热,但,汉语有没有词?什么进词?为什么要研究汉语分词?汉语如何分......
随着互联网文化和经济的飞速发展和信息爆炸时代的到来,能够在短时间内处理大规模文本且从中挖掘和抽取语言信息的计算语言学快速地......
本文研究了基于最大熵原理的汉语词性标注.文章采用了准确率增量驱动的上下文特征选取策略,而后采用EM算法量化了特征之间的相依程......
主要针对基于规则的汉语词性自动标注问题,引入了关联规则挖掘的概念和方法,给出了一种汉语词性标注规则的获取算法,并对试验结果......
兼类词的词类排歧是汉语语料词性标注中的难点问题,它严重影响语料的词性标注质量.针对这一难点问题,本文提出了一种兼类词词性标......
本文提出了并实现了一种基于定量统计分析优先的统计和规则并举的汉语词性自动标注算法,本算法引入置信区的概念,优先采用高准确率的......
提出带权约简的概念,并研究了带权约简算法.首先指出已有约简算法无法融合人类的先验知识;然后提出使用权值向量表示这类知识,用于属性......
该文基于隐马尔可夫理论,提出了一种三元词汇概率和词性概率相结合的汉语词性标注模型,并对传统的Viterbi算法进行了扩展.对统计模......
针对词性标注中单独使用概率方法或规则方法的缺陷,将概率方法和规则方法有机地结合起来,并引入了部分句法分析排除切分歧义和标注......
汉语词性标注技术在中文信息处理领域中占有十分重要的地位,本文主要对基于统计的词性标注技术进行了研究,所实现的词性标注系统主......
针对实际应用中语言模型应该占用更小存储空间且加载速度快等需求,采用最大熵模型进一步研究了汉语词性标注中设定的特征模板集和......
基于隐马尔可夫模型(HMM)对汉语文本进行了词性标注,首先介绍隐马尔可夫模型的基本概念,然后着重介绍了隐马尔可夫模型的三个基本问题......
在利用条件随机场(CRFs)进行汉语词性标注时,特征模板的选取是非常重要的一个环节,本文设计了两组特征模板,选取Bakeoff2007的CTB......
随着计算机的发展,用自然语言作为人机交互语言已是必然趋势,这就对自然语言处理的深度和广度提出了越来越高的要求。词性标注是自然......
针对汉语词性标注中词性类别划分较细、类别较多的问题,提出一种利用双层条件随机场进行汉语词性标注的方法,该方法将汉语词性标注......
针对传统的HMM模型在词性标注中具有对兼类词及其对应词类标注能力差和模型差异大的缺点,提出一种利用混合BP-HMM词性标注模型进行......
近年来条件随机场广泛应用于各类序列数据标注中,汉语词性标注中应用条件随机场对上下文建模时会扩展出数以亿计的特征,在深入分......