N元语言模型相关论文
新词识别过程中,使用分词工具进行预分词的方法,受限于训练语料而对某些领域的分词准确率不佳.针对这个问题,本文提出了一种改进方......
自然语言处理已经发展了几十年,近年来随着互联网的高速发展,人们使用计算机处理自然语言的需求越来越多。词是最小的语言单位,而汉语......
随着智慧检务工作的不断发展,纸质卷宗的电子化是检务信息化的重要环节,但受自动化识别技术的限制纸质卷宗电子化过程中不可避免的......
针对基于视频的连续手语识别的文本结果存在语义模糊、语序混乱的问题,提出一种两步法将连续手语识别结果的手语文本转化为通顺、......
为提高汉字文本的识别率,本文将基于统计的N—gram元语言模型和单字识别器概率模型结合起来.以充分利用单字识别器提供的信息。该方......
本文首先讨论了汉语方言辨识的依据及特征选取的基本原则,并由此导出了区间差分倒谱特征。然后利用GMM符号发生器和N元语言模型及A......
术语定义抽取是信息抽取研究领域的重要内容之一。文中提出了一种结合硬模板匹配和软模板匹配技术的综合术语定义自动抽取方法。文......
N元语言模型(n-gram)作为统计语言处理的主要方法,目前在汉语语言处理(词性标注、字符识别、语音识别等)中已得到广泛的应用。但是,具体N取何值为......
分类是近年来自然语言处理领域的一个研究热点。在分析了传统的分类模型后,文中提出了用N元语言模型作为中文文本分类模型。该模型......
本文使用N元语言模型,针对维吾尔语详细词典中的维吾尔语单词进行字母构成统计分析。使用Morogram工具,以字母为主要分析单位,对维吾......
公司有一款软件产品一直是用Oracle作为其数据库系统,但是在该软件的的销售过程中,有越来越多的客户提出了使用微软的SQL-Server数......