中文自动分词相关论文
专名识别是中文自动分词的重要任务.本文分析了目前流行的基本语料库和统计语言模型(SLM)的专名识别方法中存在的问题,同时以人名......
面向特定领域的搜索引擎是信息检索领域的一个重要研究课题,虽然该领域已经取得许多研究成果,但是目前基于信息安全学科特定知识领域......
Bakeoff是国际中文自动分词评测的品牌。它已分别在2003年日本和2005年韩国举办过两届。Bakeoff究竟给自动分词的传统理念带来什么......
面对当今日益增多的在线文本,如何压缩信息量,从而帮助人们快速有效的选择和利用感兴趣的信息,成为文本处理领域所关注的焦点。文本摘......
随着网络技术及Internet技术的发展,计算机技术得到了广泛应用。现代远程教育是网络和Internet应用的一个强有力的例子,它融合了现......
中文自动分词技术是网络搜索引擎的关键技术之一,是中文信息处理中的重要环节,也是智能计算、文献标引、自然语言理解和处理的基础。......
本文在对检索系统关键技术进行研究的基础上,主要实现了一个以统计分词改进算法为基础的网络信息检索系统。该系统通过网页内容提取......
中文作为人类传播信息的重要语言工具之一,中文信息处理已经成为信息处理领域的热点研究问题。中文自动分词是中文信息处理的重要......
中文自动分词是中文信息处理的一项重要的基础性任务,是机器翻译、问答系统、自动文摘等技术的基础,也是实现中文搜索引擎所必须的......
近年来,随着计算机的普及与信息化的发展,中文信息处理技术的应用日益广泛,中文自动分词技术是中文信息处理的基础,已应用在文本校......
由于来自于网络的信息具备信息量大、信息来源复杂等特点,人们在查找自己需要的信息时,已经习惯使用搜索引擎作为信息筛选的工具。......
本文提出了一种基于海量智能分词的中文自动分词新算法,该算法不依赖于现有词库,通过文本过滤和词频统计的方法进行中文自动分词,......
分词、注音和词性标注是语音合成体系结构最为初始的重要组成部分,也是语言模型需要解决的问题。中文自动分词由于歧义切分、未登......
中文自动分词是进行中文信息处理的前提,分词词典机制是影响中文自动分词的重要因素.文中对目前典型的分词词典及分词算法进行了分......
随着计算机应用领域的日益广泛以及信息处理技术水平的不断提高,自然语言信息处理技术一直倍受关注,如何提高计算机对自然语言的理......
中文自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理的一个重要问题,在很多领域扮演着非常重要的角色。中文自动分词......
语音合成技术是信息处理领域的一个重要分支,是人工智能的一个重要研究方向。语音合成的核心技术主要体现在文本分析和合成语音时......
中文自动分词是汉语自然语言处理领域一项重要的基础性研究工作,而随着新词的不断出现,中文分词结果中出现过多的“散串”,影响了分词......
该文结合了系统论观点论述了一个中英文搜索引擎原型的实现.重点是进行中文信息小型化处理,其中包含中文的自动分词、词频统计、关......
本文借助文本挖掘及其相关技术,针对航海领域,建立了一个基于Web的学术热点发现模型。该模型可对Web上所发表的科技论文进行内容挖......
在Internet高速发展的信息时代,搜索引擎是人们获得有效信息的强有力手段之一。中文搜索引擎的重点在于中文关键信息提取,其中的难点就是中文......
随着信息检索技术越来越受到人们的重视,其中的中文自动分词技术就显得越来越重要。计算机通过对文本中的词语进行识别与处理,直接......
针对中文自动分词中组合型歧义消解难的问题,提出了一种新的切分算法来对组合型歧义字段进行消歧。该算法首先自动从训练语料中提......
针对远程教育答疑环节存在的问题,设计实现一个自动答疑系统。阐述自动答疑系统的总体设计、主要算法和基于Visual-Prolog的实现技......
提出一种歧义字段与其所在句子语义联系为依据的中文分词交叉歧义处理方法。该方法模拟人浏览句子按照语义和词语相关度寻找消歧证......
在中文切分算法设计上,好的算法一般要注重两个方面,一个是提高切分精度,另一个是提高切分速度。本文在逆向最大匹配的算法切分基础上......
在分析现有几种中文自动分词算法的优劣且能实现优势互补的基础上,提出一种多种方法融合的中文自动分词算法.利用Visual-Prolog开......
文本信息过滤技术需要解决的一个重要问题是对文档进行形式化处理,使得文本成为可计算和推理的信息,而中文自动分词是中文信息处理的......
首先对各种现有的中文自动分词算法进行简要比较,并指出其存在的问胚,然后针对这些问题,设计了一个基于演化的中文自动分词算法.最......
中文自动分词模块是自动答疑系统的一个重要功能模块。在分析自动答疑系统中问句特点的基础上,提出一种面向课程答疑的中文自动分词......
汉语自动分词是远程教育智能答疑系统的基础,如何根据远程教育智能答疑系统的特点进行相关分词算法的设计是提高答疑系统智能性,促进......
模拟人浏览句子按照语境寻找消歧证据的经验,计算歧义字段与其所在句子的语义相似度和相关度,据此作为语境计算模型,利用歧义字段......
组合型歧义切分是汉语自动分词的难点之一.为此,利用CRF(条件随机场)模型,以歧义字段的上下文的词和词性建立特征模板,进行歧义消解......
设计了一个基于W eb文本挖掘的分词系统。具体介绍了如何将H tm l格式的文档转化为Txt格式文本,以及利用M M法来实现对文档的汉语......
中文自动分词是中文信息处理的基础,交集型歧义字段的消解又是中文自动分词中的重点。本文将CRFs模型用于交集型歧义字段的歧义消......
提出了相对词频的概念,据此建立了语境计算模型,利用歧义字段前后语境信息对组合型分词歧义进行消解。对高频出现的5个组合型分词歧......
中文自动分词技术是中文信息处理领域中一项重要的基础性课题,它对相关领域(如信息抽取、全文检索、数据挖掘、机器翻译、问答系统等......
计算机博弈的研究从上世纪50年代人工智能作为一门学科诞生以来就从未停止过,它在人工智能领域占有举足轻重的地位,并已取得了辉煌......
首先分析了自动分词与自然语言处理、自动分词与信息检索之间的关系 ,在此基础上 ,介绍了近年来自动分词系统实现的技术原理 ,探讨......
无论在自然语言处理还是在机器翻译中,中文自动分词都是一个重要的环节。歧义字段切分中的未登录词是中文自动分词中较难处理的部......
互联网给我们带来信息爆炸、快速经济的同时,也带来了很多不利于经济发展和人民生活的不良信息,对WEB信息的过滤成为一个热门的研......
中文自动分词,就是利用计算机将连续文本切分为以词为单位的字符序列。全文检索是以文档的全部信息作为检索对象的一种检索方式,较......
中文分词是机器学习,自然语言处理中的一个基础部分,中文分词处理要对输入的中文语句在字、词、句三个层面上进行处理。在中文中,......
在Internet日益普及的今天,语言文字作为信息的载体越来越多的出现在人们的视野中,因此自然语言理解成为了一个热门的研究领域。中......
汉语自动分词是中文信息处理领域的基础课题,也是中文信息处理发展的瓶颈之一,其中对中文分词规范的研究,即如何确定一个汉字串是否为......