中文自动分词系统概述

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:mmlovejj
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汉语自动分词是中文信息处理领域的基础课题。该系统是利用计算机对中文文章进行自动分词、识别的计算机应用系统,它包括基本的自动分词方法、歧义处理和命名实体的识别等基本模块,其各部分相互依赖,共同决定该系统的质量、价值和应用水平。该文首先对汉语分词的定义、方法、应用及困难进行了概述,后面实现了隐马尔科夫模型和最大匹配模型,最后详细介绍基于上述模型所实现的中文自动分词系统。
其他文献
根据航天实时图象处理的需求,本文设计了一种基于MPP技术的主从式并行计算机系统,主要介绍主从机通过共享数据存储器的通信方式和互斥工作方式。遵从实时性、可靠性、高精度原
滦南县着力围绕壮大村级集体经济探索脱贫路径,坚持因村制宜、强化扶持引导、筑牢人才支撑,全县村级集体经济发展持续向好,带动群众稳定增加收入,为打赢脱贫攻坚战提供了有力
孔子说的"己所不欲,勿施于人",对于我们今天的教学具有积极的意义。给别人的东西,只有一个标准,即以别人的意愿为标准。要看别人自己是否愿意,而不能依据我们的标准来强加给别
本文讨论了进化神经网络的编码表示机制,分析了它们的优缺点;提出了遗传算法的一种图文法编码表示机制,给出了相应的算子定义,以及模式、模式长度及其阶的定义;证明了一个基于图文
本文介绍了多层次试题库模型的建立和设计,以及基于多层次模型基础上的通用试题库管理系统的设计。
为了发掘辣椒株高、始花节位、单果质量、果纵径、果横径、果形指数和果肉厚度等重要农艺性状的关联位点和优异等位变异,本研究以194份辣椒核心种质为试验材料,利用广义线性
随着网络的发展,数字化信息迅速增加,人们对中文信息的处理也越来越关注,同时,现代汉语信息的处理和研究也显得尤为重要。汉语自动分词和命名实体识别是中文信息处理的基础研
利用多分辨率技术处理和分析图象是近年来的一个研究热点。多分辨率图象锥为多分辨率处理和分析图象提供了一种帝用的、有铲的数据结构和工具,本文阐述了多分辨率图象锥的概念
作为一种现代的管理工具,绩效管理已被越来越多地引入应用到社会的各个领域中。但是,对于企业中的实验室,绩效管理的应用仍然不够贴切与深入。如果直接套用现成的绩效管理模式,很
在中国人口结构和家庭结构急剧变迁、中国社会福利制度向适度普惠社会福利制度转型的背景下,为分析青少年的福利责任态度现状以及青少年的福利责任态度影响因素,本研究提出两