共现概率相关论文
工尺谱作为一种中国古代乐谱,常用于昆剧等中国传统音乐。工尺谱拥有完整的音调、音高标记,但是节奏标记不完备,一个节拍内音符的时值......
微博自身的文本特征,如内容短小、语义稀疏、信息碎片化等特点,给情感词典的扩展带来了困难,并且微博涌现出越来越多带有情感倾向......
新词识别是汉语自动分词的难题之一。在大规模中文自动分词中,新词是造成分词错误的一个重要原因。本文将新词的识别问题看成一种分......
语料库词汇一级的对齐,对于充分发挥语料库的作用意义重大。本文对汉英句子一级对齐的语料库,提出了借助于词典和语料库统计信息的有......
缩略语在汉语中的高频使用,使得缩略语的识别成为中文信息处理不可回避的问题。利用规则对初分词后形成的散串进行缩略语的识别,然......
面向开放领域文本的实体关系抽取是一项具有重要研究价值的自然语言处理任务,它的提出是为了从海量文本中高效准确地抽取有价值的......
针对微博涌现出越来越多带有情感倾向的新词,为了将这些新词扩充到传统情感词典,本文提出基于共现概率训练的情感词典的扩充算法。......