歧义切分相关论文
文语转换是一种比较高级的、有广泛应用价值的计算机语音输出的形式,具有广泛的应用前景.该论文针对主要合成基元为词的汉语文语转......
Internet技术的迅速发展导致网站上的文档信息成指数级增长,用户欣喜信息丰富的同时也为信息的无序和冗余所烦恼。文本分类作为处理......
随着信息技术的飞速发展,中文信息处理技术已经渗透到计算机应用的各个领域。词处理平台技术是中文信息处理的中间环节,是连接字处......
汉语自动分词是中文信息处理领域中的基础课题,其中,歧义切分的消除是影响分词精度的关键问题。国内外很多学者在自动分词领域展开了......
词语处理技术是基于词一级中文信息处理应用的重要基础,也是中文信息处理技术的瓶颈。词语处理首先需要解决的是词语切分问题。目前......
中文自动分词系统是利用计算机对中文文章进行自动分词、识别的计算机应用系统,它包括基本的自动分词方法、歧义处理和命名实体的识......
为加强进出口纺织原料的质量安全管理,山东检验检疫技术中心需要从媒体、论坛、博客、微博等网站里获取进出口纺织原料质量安全信......
自然语言处理(NLP)是语言学和人工智能的一个交叉域,它研究人类自然语言的自动化产生和理解的问题,对于汉语来说,它涉及自动分词、......
近年来,随着国民经济信息化的不断发展以及Internet的普及,中文信息处理技术的应用日益广泛。由于中文文本是按句连写的,词间无间......
分词就是将连续的文字序列按照特定的规范重新组合成词语序列的过程,在藏文信息处理领域分词是不可或缺的基础性工作,也成为智能化藏......
一 引言中文文本自动切词是中文信息处理的一项重要的基础性工作。中文信息处理的很多项目中都涉及到切词问题 ,如汉外机器翻译、......
分词是汉语文献处理的第一步.目前,在多种分词算法中正向最大匹配算法最为简洁、易于实现、日常应用也最为广泛.我们主要运用理论......
中文自动分词是web文本挖掘以及其它中文信息处理应用领域的基础.蓬勃发展的中文信息处理应用对分词技术提出了更高的要求.提出了......
本文提出了基于支持向量机(SVM)和k-近邻(k-NN)相结合的一种分类方法,用于解决交集型伪歧义字段.首先将交集型伪歧义字段的歧义切......
本文详细阐述了文献检索系统中自动标引技术的抽词词典、抽词算法及歧义切分等问题....
介绍了一个比较不同中文分词算法在分词上异同的软件,特别是在歧义词条切分上的异同之处,它包括了容纳各种分词算法的框架结构及其......
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开......
在分析目前分词方法的基础上提出了一种通过建立多元信息库、采用改进型的粗分算法以拔出所有可能存在歧义的句子、借助于人工干预......
汉语不同于英语,词之间没有间隔标记.而汉语分词是文本分析的第一步,且存在歧义切分,因此分词问题成为汉语分析的首要难题.通过中......
词典是汉语自动分词的基础,减少交集型歧义可以提高分词的准确率。在基于词典切分中,传统的Trie树每个节点存储一个字符,构建时产......
如何建立适于交通管理系统下信息检索子系统中的分词模块是提高检索性能的关键所在。本文在分析交通管理领域特点的基础上,提出了......
讨论了在旅游信息库汉语接口中的自动分词问题.基于系统的情况提出了模糊切分及形式分词与语法分析辅助分词相结合解决歧义切分、......
分析了中文分词词典的机制,提出了一种改进的整词分词字典结构,并针对机械分词算法的特点,将其与概率算法相结合,探讨了一种中文自......
讨论了汉语自动分词研究中的若干理论问题:分词词表、歧义切分字段、生词以及全局和局部统计量,并提出了相应的处理策略。实用型汉语......
歧义切分技术是中文自动分词系统的关键技术之一·特别是在现代汉语通用分词系统(GPWS)中,允许用户动态创建词库、允许多个用户词......
汉语自动分词是中文信息处理领域所特有的一个重要研究课题,机器翻译(MT)、自然语言理解(NLU)、情报检索(IR)等都需以自动分词作为基础. 为解决分......
对现代汉语自动分词软件评测技术提出了理论依据和实用算法。提出了分词软件的质量评价原则;评测语料库、歧义切分、人名、地名等各......