bigram相关论文
在自然语言处理领域中,词和句子是最基本的表示单位。词是一种抽象的表示方法,往往包含多种含义,不同词间的关系也各不相同。句子......
We propose a multi-channel sliced deep Recurrent convolutional neural network (RCNN) with a residual network.We expand t......
研究统计语言模型中bigram模型在自动文本分类中的应用,针对传统的向量空间模型在计算文本相似度时假设特征项相互独立的缺点,提出......
本文将部分语义信息加入到二元文法中,提出改进的二元文法索引策略。本文应用2-泊松模型的BM25公式在TREC公开数据集上进行了测试......
为通过构建高速的中文索引结构来提高Off-line模式的串匹配速度,提出了一种基于Bigram二级哈希的中文索引结构。该索引采用中文GB23......
用计算机信息处理技术实现文本自动分类是计算机自然语言理解学科共同关注的课题。该文提出了一种基于Bigram的无词典的中文文本特......
计算语言学科虽然诞生的时间不长,但是近年来发展势头迅猛,已经渗入了如搜索引擎、数字图书馆等许多应用领域。以统计理论为基础建立......
中文分词的方法主要可分为基于规则和基于统计两大类:前者一般借助于词图的方法,将分词问题转化为最优路径问题,通常切分结果不惟一;后......
介绍了英汉机器翻译引擎的组成,详细描述了具体实现过程,包括翻译前的预处理、查词消兼、句法分析和转换生成。......
利用汉语语言的统计规律对汉语连续语音识别系统的声学到语音学的结果进行纠错及音字转换具有重要意义.本文介绍一个采用统计方法......