N-GRAM语言模型相关论文
该文针对语音识别和中文整句输入法的具体任务,对统计语言模型中的构造和一些关键技术进行了深入的研究,主要讨论了N-gram模型、N-......
为改善现有传统情感词典无法精准捕捉乡村旅游情感词的情况,提出了一种面向在线评论自动构建乡村型情感词典的方法。以江西婺源为......
近年来,软件开发者大多采用代码复用技术提高开发效率,其中API是代码复用技术中最常见的表现形式。然而,开发人员在享受API带来的......
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比......
针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram......
汉语音字转换是中文键盘输入、汉语语音识别和中文信息处理的基础,也是一个非常具有挑战性的问题.文中分析了汉语音字转换的研究现......
随着互联网技术的发展和普及,电子文本的数量日益增加。电子文本的爆炸式增长造成了文本质量的下降,而基于人工进行审查和评估明显......
房价满意度作为衡量社会发展的一个重要指标,正在引起社会的广泛关注但是由于难以量化数据收集繁琐时效性弱等困难,相关研究无法深入......
学位
随着人工智能的兴起,智能家居、智慧医疗、智能教育等将逐渐走进我们的生活、工作和学习。人工智能的这些应用都需要语音识别系统......
分析了中文智能输入技术的研究现状和存在的问题,提出了基于混合n-gram的中文智能输入技术,给出了系统实现的架构,研究了混合2-gra......
针对当前维吾尔语语言模型存在的语料库数据稀疏问题以及困惑度较高等问题,在SRILM和MITLM两种工具生成的2-gram,3-gram,…,9-gram......
特征提取是文本分类的重要环节,特征提取时可以选择字、词和短语作为特征。以词作为特征时,特征提取过程中需要分词工具、词干提取工......
本文提出了一个基于n-gram语言模型进行文本表示,采用链状朴素贝叶斯分类器进行分类的中文文本分类系统。介绍了如何用n-gram语言......
提出一种基于语义扩展模型、分步骤的无监督关键词抽取方法。选择词语的网页结构特征、词性、词长、TF-IDF值等特征,通过聚类算法......
机器翻译评测是机器翻译领域研究的重点和难点,对研究人员、系统开发者和用户均具有重要的指导意义。但是随着机器翻译的实用化,传......
学位
人名音译指利用源语言及目标语言发音规则的异同将源语言形式人名翻译成目标语言形式,在机器翻译、双语语料库对齐等多语言处理任......
学位
随着互联网的迅速普及和信息的快速更新,人工智能已成为未来科技发展的重要方向。语音识别是人工智能研究的一个重要分支,其目的是......
学位
针对传统的向量空间模型及一元语法模型表示话题的文本特征时忽略词语之间语序关系的问题,提出一种基于NGram语言模型的并行自适应......