统计语言模型相关硕士博士期刊学术论文

统计语言模型相关论文

基于深度学习的文本纠错关键技术研究

随着我国移动网络行业和大数据技术的快速发展,各类互联网应用层出不穷,导致互联网用户规模呈指数级增长,因此累积了海量非结构化......

学位

中文文本纠错预训练语言模型注意力机制统计语言模型模型集成

基于CLDNN混合模型的中文语音识别系统

目前语音识别技术中运用较成熟的高斯混合-隐马尔科夫模型（Gauss MixedModel and Hidden Markov Model,GMM-HMM）,其结构简单,实现方......

学位

卷积神经网络双向门控循环单元连接时序分类统计语言模型中文语音识别系统

基于自适应蚁群算法的部件组装优化

合成生物学是最近兴起的生命科学领域的一个迅速发展的重要分支,它与物理学、工程科学、化学、计算机等学科交叉结合。而合成生物......

学位

统计语言模型蚁群算法合成生物学 GenoCAD软件

基于代码大数据的代码推荐工具的研究

程序员在编程过程中随时可能遇到困难,此时与程序员已编写代码相关的高质量代码示例有助于程序员理解代码并快速完成编程任务。但......

学位

代码推荐统计语言模型文本匹配算法深度学习

CELM:基于交叉熵的文本检索模型

本文对文本检索中的查询生成模型进行了扩展,提出一种基于交叉熵(Cross-Entropy)的CELM检索模型.通过统计语言建模技术,CELM模型把......

会议

CELM 信息检索交叉熵统计语言模型

基于互信息的词聚类方法

基于类的统计语言模型是解决统计模型数据稀疏问题的重要方法。传统的统计聚类方法基于含婪原则，常以语料的似然函数或困惑度(perpl......

会议

互信息词相似度分层聚类算法统计语言模型

基于统计语言模型蒙古文词汇分析校正器的设计与实现

自动校对是自然语言处理领域中一项重要的研究内容。在蒙古文信息处理研究中,对蒙古文自动校对的探索还没有提出一个很好的解决方......

会议

自动校对自然语言处理蒙古文信息处理统计语言模型词汇分析

统计语言模型中一些问题的思考

数据稀疏是统计语言学研究中一个永久的话题.如何解决数据稀疏问题?如何使数据不稀疏?一直是大家所关心的问题.本文仅仅从模型和数......

会议

统计语言模型数据稀疏支持向量机计算语言学

蒙古语连续语音识别在不同结构语言模型下精度的讨论

统计方法处理口语至今仍然是口语处理的核心技术. 目前处理水平较高的英语,中文及日本语等语言均采用统计处理方法. 但是,各自语言......

会议

蒙古语连续语语音识别统计语言模型黏着语言相似词分类 bigram模型

基于统计机器学习算法的汉语分词系统的研究

在词汇级的中文语言处理中，存在两个基本的问题：其一是汉语自动分词，其二是中文命名实体识别。通常的系统都把这两个任务分开处理，也就......

学位

统计语言模型汉语自动分词中文命名实体识别基于词的三元语言模型基于类的语言模型

基于互信息的统计语言模型数据平滑算法

自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种能够模拟人类语言认知过程的计算模型。但是当前......

学位

统计语言模型数据稀疏数据平滑互信息

问答系统中文输入纠错技术研究

在迅速发展的Web时代,问答系统在互联网上扮演了越来越重要的角色,而日益增多并且成熟的互联网用户对问答系统的要求也越来越高,其......

学位

问答系统统计语言模型输入检查纠错解码算法

统计语言模型研究及其在汉字识别中的应用

该文主要研究构造汉语统计语言模型的关键技术及其在手写体汉字识别后处理中的应用方法.具体地讲,该文从如下几个方面进行了研究.......

学位

统计语言模型手写体汉字识别触发对数据平滑词的自动聚类

名片OCR识别知识后处理

该文针对日文名片自动录入设计了一套实用的OCR识别知识后处理系统.该文在对日文名片的特点进行分析的基础上,提出了基于名片内容......

学位

名片识别 OCR知识后处理统计语言模型 TF.IDF算法

拼音键盘输入的研究及其在WINDOWS系统下的实现

该文研究的音字转换模块中,首先实现了对用户键盘输入拼音串的分析和预处理,以汉语拼音知识为指导,研究了拼音流的自动切分、检错......

学位

统计语言模型音字转换输入法接口

基于统计语言模型的汉语分词消歧研究

自然语言处理已经发展了几十年，近年来随着互联网的高速发展，人们使用计算机处理自然语言的需求越来越多。词是最小的语言单位，而汉语......

学位

汉语分词交集型歧义组合型歧义统计语言模型 N元语言模型自然语言处理计算机自然语言处理汉语信息处理

大规模统计语言模型实现技术研究

统计语言模型是很多自然语言处理任务的重要模块。一般而言，用来训练语言模型的数据量越大，训练得到的语言模型质量越好。Google公司......

学位

自然语言处理大规模数据统计语言模型词频数据语料训练

基于网络用户信息的个性化拼音输入法研究与实现

汉字输入技术是中文信息处理领域特有的一项基础性关键技术，中文输入法是中文用户使用计算机必备的应用软件。依赖于键盘的中文输入......

学位

中文输入拼音输入法音字转换统计语言模型网络用户信息中文信息处理

引入WiKi知识库的历史网页推荐性检索系统的研究与实现

本文主要是分析在历史网页搜索中若干导致用户不满意检索结果的原因,并提出解决方案。在历史网页搜索中一个重要的特点:检索结果按......

学位

历史网页主题模型推荐性检索系统查询过滤相关反馈统计语言模型

维吾尔语命名实体识别和翻译研究

命名实体识别和翻译是文本理解和处理的基础工作，对于信息检索、信息抽取、数据挖掘、机器翻译等自然语言处理应用也起着关键性的作......

学位

维吾尔语命名实体识别机器翻译文本理解自然语言处理统计语言模型

松下网络OCR后处理系统

该论文描述了一个专为松下网络OCR引擎开发的OCR后处理系统.这个OCR引擎使用的是比较新但还不成熟的技术,现在它的词层识别正确率......

学位

OCR后处理统计语言模型编辑距离大规模加标语料

基于多步处理策略的汉语自动分词研究

自然语言处理是人工智能的一个重要分支。汉语自动分词是中文自然语言处理的一项基础性工作，也是中文信息处理的一个重要问题。汉语......

学位

自然语言处理汉语自动分词统计语言模型时间语词计算机应用技术

统计语言模型N-best重排序算法的研究

统计语言模型是自然语言处理中一个非常重要的研究方向。它使用统计学的办法来估计自然语言中词的概率分布并以此来计算一句话出现......

学位

统计语言模型重排序最小错误率训练语音识别

基于统计语言模型的检索模型及其平滑技术的研究

本文主要研究SLM-based检索模型与传统检索模型的对比，以及SLM-based检索模型中的数据平滑技术，包括参数平滑和语义平滑。首先本......

学位

信息检索检索模型统计语言模型语义平滑参数平滑

贝叶斯文本分类器的研究与改进

随着网络信息的发展,信息自动分类已经成为人们获取有用信息不可或缺的工具。贝叶斯作为其中的一种分类方式,应用在众多领域。贝叶......

学位

贝叶斯文本分类数据稀疏 laplace平滑方法统计语言模型 uni-gram平滑方法

基于互信息的统计语言模型平滑技术

自然语言处理是计算机科学中一个引人入胜、富有挑战性的课题。它的任务是建立一种能够模拟人类语言认知过程的计算模型。但是当前......

学位

自然语言处理统计语言模型数据稀疏数据平滑互信息困惑度

手机汉字智能输入的研究

近年来随着手机技术的发展与手机的普及,基于手机的应用服务也越来越多,包括短信、网络浏览甚至可以进行个人信息的处理工作.一种......

学位

汉字输入法数字键盘统计语言模型粗集前端处理器

中文文本错误自动校对方法的研究

Kukich从智能处理技术的角度将英文的文本错误分成两大类：孤立词错误(isolated-worderror)和上下文依赖词错误(context-dependentwo......

学位

文本错误自动校对统计语言模型 N元文法编辑距离动态权重自动分配

基于统计语言模型的汉语词法分析研究

　　词法分析是自然语言处理领域中最基础的处理步骤，尤其对汉语这种没有分割符的语言来说更是如此。本文研究的汉语词法分析主要包......

学位

统计语言模型汉语词法分析词义相似度音字转换触发对

基于两阶段语言模型的特定实体搜索

传统的通用Web搜索模型检索的是与查询相关的所有领域的信息，并且只能以网页的形式作为返回结果进行展示。从某种意义上说，用户对返......

学位

实体搜索信息检索统计语言模型 web挖掘 web搜索

本体论和统计语言模型相结合的跨语言信息检索研究

互联网时代的到来，使得高效的搜索引擎成为人们获取信息的最重要手段之一，信息的日益国际化及语言之间的障碍形成了人们对跨语言信息......

学位

跨语言信息检索本体论统计语言模型文档排序

基于HMM建模的蒙古语连续语音识别系统的研究与实现

语音识别(speech recognition)是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。其根本目的是研究出一种......

学位

模式识别语音识别隐马尔可夫模型(HMM) 三音子(tri-phone) 三词文法统计语言模型

基于统计语言模型的手机中文输入系统的研究与实现

智能中文输入技术在桌面平台已经得到了广泛的应用，通过研究手机平台汉字输入的特点，本文将智能输入技术引入到手机平台上，并在手机平......

学位

中文输入法统计语言模型口语语料自学习模型 Symbian

基于统计语言模型和Passage特征的信息检索模型研究

信息检索模型是对信息检索任务及实现方法的一种抽象描述。信息检索模型是信息检索理论研究的一个核心内容,因此对于它的研究有重......

学位

信息检索模型统计语言模型 passage 平滑

条件随机场在序列标注任务中的应用研究

随着社会的日益信息化，人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性的......

学位

序列标注任务中文分词命名实体识别统计语言模型条件随机场信息抽取

基于统计和潜在语义分析的混合语言模型的研究

语言模型在语音识别中占据着重要的地位,它担负着把拼音转化成汉字的重任,语言模型性能的好坏直接影响到语音识别的结果好坏。当前......

学位

统计语言模型潜在语义分析语言模型困惑度

基于视觉信息的上下文广告关键词提取算法研究

互联网已经成为目前最为重要的广告媒介之一，它能够以低成本将商品和服务向全世界的各个角落展示，这种独特能力吸引了众多的网络广告......

学位

上下文广告网页分块统计语言模型视觉特征关键字提取

改进贝叶斯模型在中文文本分类系统中的应用

随着Internet的迅猛发展，电子文本信息迅速膨胀，文本分类系统作为处理和组织电子文本信息的一项重要技术，成为信息处理领域不可或缺的......

学位

中文文本分类贝叶斯模型数据稀疏统计语言模型 Unigram 信息处理

基于n-gram模型的中文分词技术研究

随着互联网的广泛应用，语料库知识的不断扩大，人们希望能从这些语料中进一步挖掘出更多有用的信息，其方法通常是建立一个面向各自应用......

学位

语料库统计语言模型中文分词信息论自然语言处理系统边界探测算法

基于条件随机域模型的文本信息提取

信息抽取是指从海量的文档集合中抽取需要信息的自然语言处理技术，是自然语言处理领域中非常重要的子领域，是近十几年发展起来的新领......

学位

条件随机域模型文本信息提取统计语言模型参数估计序列标注组块标注

基于多语言模型融合的鲁棒手写后处理方法

随着智能终端的飞速发展,在移动端市场上,开发一种具备篇章级连续手写能力的输入法是很有必要的。本文提出了一种全新的手写输入模......

学位

统计语言模型语句级手写后处理鲁棒语言模型循环神经网络错误传递

海量语言模型的研究及其在机器翻译中的应用

近年来,随着自然语言处理技术的发展和大规模语料库的出现,各类自然语言应用中使用的语言模型规模也越来越大。机器翻译是大规模语......

学位

语言模型海量语料库机器翻译

大词汇量连续语音识别系统的统计语言模型应用研究

随着语音识别技术深入广泛的应用,它越来越将成为模式识别中的一个非常重要的研究课题,它的发展将会对未来的生活、工作带来极大的......

学位

大词汇量连续语音识别统计语言模型 Tri-gram语言模型语料库语言模型自动更新

基于词典与日志挖掘的查询扩展问题研究

在信息检索系统中，由于用户查询语句过短而导致的词不匹配、信息迷向和信息过载等问题，成为制约检索质量的主要因素之一。实践表明，根......

学位

信息检索查询扩展统计语言模型似然比日志挖掘数据平滑策略

基于词向量的中文分词方法研究

随着人们对计算机自动化和智能化的渴望,人工智能的发展和研究应运而生。自然语言处理作为人工智能的重要研究方向之一,在对语言处......

学位

中文分词统计语言模型神经网络词向量

基于统计语言模型的个性化API补全方法研究

API补全是当今开发者们使用最为频繁的代码补全方法之一。近年来,大数据与人工智能技术发展迅猛,这为API补全带来了新的可能。其中......

学位

代码补全深度学习统计语言模型循环神经网络个性化推荐

基于机器学习的文本分类

文本分类能帮助有效组织信息,快速区分信息质量,满足用户个性需求.本文主要介绍的内容有文本分类的背景、国内外的研究现状以及利......

期刊

文本分类统计语言模型中文分词神经网络模型

基于语言模型的中文文本分类系统

文本分类技术是近年来自然语言处理研究领域的一个热点，向量空间模型(VSM)是文本分类的经典模型，该模型在应用时假设词与词之间是相......

会议

统计语言模型中文文本分类器空间模型自然语言处理分类准确率研究领域向量相互关系经典模型分类技术方法设计词序稳定性信息实验高阶

面向民族语言信息处理的汉语分词方法

本文提出了一种有效的汉语分词方法。该方法在计算N元概率时采用统计语言模型中常用的Katz平滑算法,对计算N元概率时所用的最大似......

会议

民族语言信息处理汉语平滑算法统计语言模型分词方法最大似然法计算概率分词系统方法设计词典结构字符串复杂度映射空间短语

基于统计语言模型蒙古文词汇分析校正器的设计与实现

自动校对是自然语言处理领域中一项重要的研究内容。在蒙古文信息处理研究中,对蒙古文自动校对的探索还没有提出一个很好的解决方......

会议

统计语言模型蒙古文词汇分析校正器自然语言处理信息处理校正方法校对解决方案设计

看过本文同时还关注