交集型歧义相关论文
随着人机通信研究的不断深入,语音合成技术越来越受到各国学者们的关注。语音合成系统要想提高其合成的语音的自然度,关键的第一步就......
随着网络技术及Internet技术的发展,计算机技术得到了广泛应用。现代远程教育是网络和Internet应用的一个强有力的例子,它融合了现......
自然语言处理是计算机科学领域中的一个重要研究方向,是人工智能的一个重要分支。汉语自动分词是中文信息处理的重要基石。困扰汉......
教育信息化是国家教育产业发展的重要趋势,它能够打破地域之间和学校之间的教育屏障。而信息化教育平台能够很好的打破障碍,促进教......
词法分析是自然语言理解系统的第一步,它的好坏将直接影响上层模块处理信息后应用的效果。在词法分析过程中要解决的关键问题是分词......
针对中文中歧义字段对中文处理及理懈带来的诸多问题提出了一种基于自然语言理懈的中文汉字歧义消除算法。对于交集型歧义和组合型......
汉语自动分词是中文信息处理领域的一项基础性课题,对现有的汉语分词方法作了简单的概述和分析,然后提出了一种新的分词方法,该方......
中文分词中,交集型歧义检测方法采用的双向最大匹配法与全切分方法存在着各自的弊病,无法满足大规模数据的精确处理。为此,提出了......
在最大匹配法(MM)的基础上,提出了二次回溯中文分词方法。该方法首先对待切文本进行预处理,将文本分割成长度较短的细粒度文本;利......
歧义处理是中文分词的难点之一,其中交集型歧义占该类问题的主要部分,而无监督学习可以利用互联网上的无标注语料库来处理该问题.......
中文分词是中文信息处理中最重要的预处理,分词的速度和精度直接影响信息处理的结果。歧义现象出现频繁,是目前中文分词的一大难题......
切分速度和精度是中文分词系统的两个主要性能指标。针对传统的中文分浏中出脱的分词速度慢和分词精度不高的问题,采用了双层hash结......
提供汉语检索接口是MIS应用的一大趋势,其主要困难在于如何让计算机理解汉语检索用语,为此本文构建了MIS智能检索接口中的汉语分词系......
本文提出了基于支持向量机(SVM)和k-近邻(k-NN)相结合的一种分类方法,用于解决交集型伪歧义字段.首先将交集型伪歧义字段的歧义切......
交集型歧义的切分问题是分词阶段需要解决难点之一。该文将交集型歧义的消解问题转化为分类问题,并利用融合丰富字特征的最大熵模......
在分析现有的藏语自动分词方法基础上,该文通过分析藏文构词规则、句法结构、词的前后词性关系、后加字(R)的添接法和格助词的用法等......
本文对国内外自动答疑系统的研究现状进行了分析,对常用的分词词典机制和分词算法进行了理论研究,深入讨论了分词过程中常出现的歧......
歧义处理是影响分词系统切分精度的重要因素,是自动分词系统设计中的一个最困难也是最核心的问题。该文利用一种统计的方法来解决交......
在最大匹配法(The Maximum Matching Method)的基础上,提出了一种回溯正向匹配(The Backtracking Matching Method)的中文分词方法。该......
中文分词是中文信息处理的基础,歧义问题是中文分词的一个难点,而交集型歧义问题占歧义问题的90%以上,因此对交集型歧义问题的研究是中......
讨论一种消除中文匹配过程中所产生的交集型歧义的方法.该方法通过词典切分方法对中文文本进行切分,找出文本中的词语,作为理解中......
藏文自动分词是藏文信息处理中一项不可缺少的基础性工作,是藏文搜索引擎、语法信息词典建设、机器翻译、语音合成、文本自动分类......
利用最大熵模型研究中文自动分词中交集型切分歧义的消解.模型输出的类别为两种:前两个字结合成词和后两个字结合成词.模型采用的......
汉语自动分词是远程教育智能答疑系统的基础,如何根据远程教育智能答疑系统的特点进行相关分词算法的设计是提高答疑系统智能性,促进......
针对交集型歧义这一汉语分词中的难点问题,提出了一种规则和统计相结合的交集型歧义消歧模型。首先,根据标注语料库,通过基于错误驱动......
提出了一种消除中文分词中交集型歧义的模型。首先通过正向最大匹配法和逆向最大匹配法对中文文本信息进行分词,然后使用不单独成词......
在正向最大匹配法的基础上,提出了一种便于在网络搜索引擎上使用的消除歧义的方法。通过利用单字词和二字词的高频特性以及不同词......
中文自动分词是中文信息处理的基础,交集型歧义字段的消解又是中文自动分词中的重点。本文将CRFs模型用于交集型歧义字段的歧义消......
自然语言处理的目标之一就是找到一种方法把由简单词序列构成的句子中加上丰富的注释符号,使句子表达的含义从有结构标注的句子中......
随着计算机技术的发展,人们已经进入了以网络为核心的信息时代,在这个信息急剧膨胀的社会里,如何获取和掌握有用的信息成为了个人......
学位
随着Internet及网络技术的发展,计算机技术得到了广泛应用。网上教学平台是Internet和网络应用的一个典型案例,而自动答疑系统是网......
<正> 汉语词切分要解决的重要问题之一是消除切分歧义。所有的切分歧义中能够用语法知识解决的约占90%以上,而涉及到语义和语用知......
为了降低正向最大匹配分词算法的切分错误率,分析了产生这个错误率的原因,提出了一种改进的正向最大匹配分词算法,即增加一个交集......
在分词过程中如何处理歧义切分是中文分词算法要解决的难点之一.文中提出了一种改进的基于词典和基于统计的组合中文分词算法,能够......