汉语自动分词相关论文
本文给出我们为建立国家标准《信息处理用现代汉语分词词表》而制订的规范(草案),目的是广泛征求意见,引起讨论,以期改善之.......
本文通过对计算机汉语自动分词的分析和研究,提出了基于相邻知识的自动分词方法。介绍了汉语分词系统,该系统的自学习机制,提高系......
随着管理信息系统技术的发展,人们对检索接口的灵活性要求越来越高,本文提出了一种自然语言检索接口的方法,并设计了一个产生式规则索......
主题词自动标引中的知识处理方法靳从樊春丽杨静宇(南京理工大学江苏210094)AbstractThispaperfirstpointsoutthenecessityofknowledgeprocessingintheChinesewordsegmen...
Key words automatic indexing knowledge processing Jin......
1995年全国第三届计算语言学联合学术会议评介由中国中文信息学会、中国计算机学会、中国人工智能学会和北京市语言学会共同发起的全国......
本文提出了一种利用句内相邻字之间的互信息及t-测试差这两个统计量解决汉语自动分词中交集型歧义切分字段的方法.汉字二元语法关系(bigram)为......
一 引言建立一个“信息处理用现代汉语分词词表”是国家社科研究“九五”规划重大项目《信息处理用现代汉语词汇研究》之子课题 9......
随着互联网络快速发展,互联网日益成为舆情产生和传播的重要场所,网络舆情在社会生活中扮演着越来越重要的作用。为了加强互联网管......
伴随着互联网技术的飞速发展,信息获取已经逐渐成为人们生活工作必不可少的内容。但是由于信息量的日渐庞大,信息种类的复杂繁多,......
在词汇级的中文语言处理中,存在两个基本的问题:其一是汉语自动分词,其二是中文命名实体识别。通常的系统都把这两个任务分开处理,也就......
随着信息技术的飞速发展,中文信息处理技术已经渗透到计算机应用的各个领域。词处理平台技术是中文信息处理的中间环节,是连接字处......
汉语自动分词是目前中文信息处理中的重要环节,它是中文自然语言理解、机器翻译中基本的步骤.汉语自动分词的难点在于歧义字段的切......
本文研究基于文本分类技术的自动诊病系统。已有病案记录了疾病现象与疾病种类的关系,利用机器学习方法构造分类器,可以习得疾病现象......
该文从汉语自动分词和词性标注的歧义消解这一基本问题入手,进行了统计方法框架下汉语自动分词和词性标注一体化模型的探索.具体的......
近年来,随着我国国民经济的不断发展以及Internet的普及,中文信息处理得到越来越广泛的应用。由于历史的原因,当前在计算机产业中,中文......
该文设计并实现了一个汉语自动分词系统,对系统中采用的关键技术进行具体介绍.词典查找是影响系统切分速度的重要因素.该文提出一......
自然语言处理是人工智能的一个重要分支。汉语自动分词是中文自然语言处理的一项基础性工作,也是中文信息处理的一个重要问题。汉语......
随着Internet技术的飞速发展,WWW已成为人们进行信息交流不可缺少的巨大的信息空间。面对如此巨大的海量信息,人们在寻找自己所需的......
分词词典是汉语自动分词系统的一个基本组成部分,词典的查询速度直接影响到分词系统的处理速度。在因特网上的中文文本检索、汉字......
汉语自动分词方法一直是中文信息处理乃至人工智能领域的重要研究内容。其中歧义消解作为该领域最重要也是最困难的两个研究重点之......
在实际信息检索系统中,信息检索系统的查全率和查准率都不是很高,针对不同的文献集,信息检索系统的性能也不一样,很多系统尽量适应各种......
未登录词的识别是汉语自动分词的难点之一,而中文机构名是未登录词的一个重要部分,涉及广泛,种类繁多,形态各异,且绝大多数未收入到词典......
随着科学技术的发展和海量信息的涌现,信息处理技术已经成为当今世界发展不可或缺的一部分,要在海量的信息中提取有用的知识,就必......
随着信息化时代的不断进步和发展,人们获取信息的手段也在不断的发生着变化,从原始的手工查找到现在的计算机搜索引擎。计算机技术......
汉语自动分词是中文信息处理的基础工程,中国人名的自动识别则是汉语自动分词的难点之一,已经成为制约汉语自动分词系统准确率的一大......
词切分是像汉语这类非拉丁语言的一个特有问题,并且由于汉语组词中普遍存在着歧义性和语境依赖性,这一问题也是一个尚未得到彻底解......
本文提出一种通过人工考察字形、词形层次生成过程,确定汉语字形、词形层次切分的方法。该方法应用于汉字字形分析,揭示了汉字字形......
特邀国内著名专家笔谈九十年代中后期计算机发展趋势(三)山西大学计算机系主任刘开瑛教授讲定性定量相结合的自然语言处理综合集成技......
基于汉语自动分词与自动标引、自由标引与自由词标引、自动摘要、自动分类、文本检索与全文检索等分析了我国计算机汉语语义组......
中文命名实体识别是汉语自动分词、句法分析等基础研究的重要前提之一,也是信息检索、信息抽取和机器翻译等应用研究的基础之一......
在机器翻译的研究中,混合式方法是一种好方法。本文的工作有三部分:第一部分讨论完全实例的机器翻译,以及句型转换的机器翻译和近似......
新词识别是汉语自动分词的难题之一。在大规模中文自动分词中,新词是造成分词错误的一个重要原因。本文将新词的识别问题看成一种分......
请下载后查看,本文暂不支持在线获取查看简介。
Please download to view, this article does not support online access to view......
书面汉语自动分词和理解系统PTCUS是一个将分词和理解并行处理的系统,与现有的处理方法相比,PTCUS使用的方法能够较好地处理汉语特有......
本文讨论人工神经网络技术应用于汉语自动分词的映射模型和性能,着重分析网络结构和学习算法对歧义词切分的影响,在大量仿真实验的基......
汉语自动分词是信息提取、信息检索、机器翻译、文本分类、自动文摘、语音识别、文本语音转换、自然语言理解等中文信息处理领域的......
自动分词技术是汉外机器翻译的基础工程。 汉语自动分词不仅是汉外机器翻译的必要环节,也是各种汉语信息处理包括语音处理、词频......
汉语分词是中文信息处理的基础,它是由计算机自动识别文本中的词边界的过程。从计算机处理过程上看,分词系统输入的是连续的字符串(C......