汉语分词相关论文
依存句法分析是识别句子中词与词之间的语义修饰关系并构建依存句法树的过程。依存句法树能够简洁高效的表达句子的句法结构信息,......
汉语词法分析是中文信息处理的基础,现阶段汉语词法分析的主流技术是基于统计的方法,这类方法的本质都是把词法分析过程看作序列数......
本文概括介绍了我国中文信息技术的发展历程及汉字输入技术、中文搜索引擎、汉语分词、中文平台的发展现状和发展状况,并对各种汉......
未登录词的识别一直是汉语分词研究的焦点和难点,本文通过对各类未登录词的用字频率及上下文进行了详细地分析,提出一种基于混合策......
本文以学界两次对组合型歧义字串考察的矛盾结果为引子,指出在现代汉语自动分词中"组合型歧义"和"切分变异"的概念界定不清,并......
在自然语言处理系统的应用过程中,很多系统允许用户自由挂接一部或多部领域词典,本文首先对采用二次分词方法产生的二次分词歧义现......
汉语数词的翻译是汉英机器翻译系统中一个虽小但不容忽视的问题,本文通过对各类汉语数词及其上下文进行详细地分析,采用了汉语数词......
首届语言文字应用研究青年优秀论文奖颁奖会暨《语言文字应用》第六次编委会2月16日在北京召开。本刊顾问和编委、获奖代表和评奖......
由国家技术监督局主公的中文信息处理标准化国际研讨会于 1989年3月 21日到3月24日在北京召开。共有1000多位中外学者和专家参加了......
经过分词处理的大型汉语语料库是进行语言学和计算语言学研究的重要资源。一致性是衡量分词语料库质量的重要标准之一。本文列举了......
文章介绍了搜索引擎面临的智能化挑战以及未来的智能引擎的特征和技术。
The article introduces the intelligent challenges th......
有关汉语分词的几点意见进明由于汉语在书写上,词与词之间没有空格,是连着写的,而汉语里的语素、词、词组并无不同的标记,界限相当模糊......
关于汉语分词问题之我见杨成凯一从逻辑上讲,研究分词问题关系到:1什么是词?2怎样分词?这两个问题有联系:知道什么是词,就可以制定辨认......
从汉语句法分析等后续处理的观点来看,分词错误所造成的不良影响必须予以重视。首先,分词错误,无论是在不该切的地方切了,还是在该切的......
浅谈汉语分词的标准孙宏林分词是汉语信息处理中的一项基础工程。解决汉语分词问题,意义重大,但困难重重,所以“分词问题已成为当前......
关于分词规范和规范词表的若干意见袁毓林一、分词困难的两种类型1判断上的困难对于结构类型相同、结构项的语法属性相同的字串,哪......
文章归纳整理了面向Web的藏文文本对分词系统的要求,对比参照其他藏文分词系统的优缺点并借鉴汉语分词系统的一些好的方法,设计开......
汉语分词调查所显示的强烈的双音词化倾向,透视出“双字格”由于具备科学 范式的基本特征,已逐渐发展成汉语构词范式。这是因为双字......
一 引言建立一个“信息处理用现代汉语分词词表”是国家社科研究“九五”规划重大项目《信息处理用现代汉语词汇研究》之子课题 9......
20 0 3年 7月 7日至 12日 ,第 4 1届国际计算语言联合会 (4 1stAnnualMeetingoftheAssociationforComputation alLinguistics,4 1t......
医学英语是ESP的一个重要分支,但迄今为止尚未见到较大规模的医学英语语料库建设。本文介绍了医学著作英汉平行语料库的构建工作,......
近年来,档案处理技术已经朝着数字化、信息化、网络化的方向飞速发展。传统的纸质档案处理方法在一定程度上限制了档案信息的共享......
本文主要介绍了汉语分词中未登录词识别与词性标注方法。未登录词是影响汉语分词准确率的一个重要因素,未登录词包括人名、地名、时......
该文提出了一个"基于继承的汉英直译系统",该系统是将继承理论应用于机器翻译的一个成功的尝试.该系统使用了一种"基于属性继承的......
该文从中文搜索引擎的分类技术,自动分词技术和检索技术等主要三个方面探讨中文智能搜索引擎的研究,系统论述了智能搜索引擎技术的......
汉语中词的离合是指词的构成元素(两个或多个汉字)之间的结合不很紧密,可以在其间插入某些其它成分而被分离,但被分离的词所表达的......
自然语言处理已经发展了几十年,近年来随着互联网的高速发展,人们使用计算机处理自然语言的需求越来越多。词是最小的语言单位,而汉语......
随着计算机的广泛应用和互联网技术的迅猛发展,社会的信息总量呈指数级增长。面对信息爆炸带来的挑战,亟需一些智能化的工具来帮助用......
本论文主要是研究利用计算机分析汉语语句。在论文中,详细介绍了汉语语句分析系统的算法思路和具体实现。本文一共包括六章。 第......
汉语自动分词是中文信息处理领域中的基础课题,其中,歧义切分的消除是影响分词精度的关键问题。国内外很多学者在自动分词领域展开了......
随着计算机技术、多媒体技术及网络技术的飞速发展,网络学习作为一种新兴的教学组织形式,以其突破时空限制、教学资源丰富、交流反......
为了让计算机具有处理甚至理解自然语言的能力,人们发明了很多自然语言语义分析理论。而在汉语的计算机处理中,大部分的语义分析都......
汉语分词是信息检索、机器翻译、文本校对等中文信息处理重要领域的基础。由于汉语中存在词语规范、歧义和未登录词等问题,汉语分......
学位
随着 Internet 上中文网页的急剧增加和中文电子出版物的迅速普及,以非受限文本为主要对象的中文自然语言处理的重要性越来越受到人......
随着社会的日益信息化,人们越来越强烈地希望用自然语言同计算机交流。自然语言理解是计算机科学中的一个引人入胜的、富有挑战性......
随着Internet技术的迅速发展,自然语言处理已经成为信息处理领域一个引人注目的研究热点。由于汉语的特殊性,大多数汉语自然语言处......
随着深度学习的发展,目前汉语分词在封闭领域上已经达到了很高的性能。然而,当应用场景由封闭领域切换到开放领域时,分词性能会显......
网络技术的发展使越来越多的数字化信息以各种不同的形式存在于全球各地的计算机中。从爆炸性增长的数字信息中迅速有效地获得用户......
【目的】针对电子商务平台的中文产品评论,提出一种面向供应链的客户关注特征挖掘方法。【方法】以产品评论数据预处理方法为核心,......
本文提出一种通过人工考察字形、词形层次生成过程,确定汉语字形、词形层次切分的方法。该方法应用于汉字字形分析,揭示了汉字字形......
本文论述了中文电脑校对的发展现状及发展趋势,及用词库进行校对,使系统词库的组织将更加合理高效。
This article discusses the s......