基于单元合并的汉字切分算法的改进

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:yangguaiguai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文介绍了对基于单元合并的汉字切分算法作出的改进。
其他文献
本文对网络上汉字的显示与传输进行了研究,提出-种新的在Web服务器端直接解决汉字繁简体内码转换的方案,使得只有一种内码的中文主页也可以自动地对不同内码浏览器提供支持,而不
【摘要】矿图是采矿技术专业的一门主要课程,它以地图知识为基础,介绍煤矿常用矿图,培养学生矿图的识读和应用技能,是煤矿生产技术与管理人员或基层干部都应该掌握的基本知识。一体化教学是应职业教育教改出现的一种新教学方法,它将学生职业能力的理论和实践相结合为一个整体,整理融会教学环节,以提高学生的综合素质。那么,矿图课程的一体化教学应如何开展?对此进行了探讨。  【关键词】矿图一体化教学教学设计一体化教学
文档自动分类是信息处理领域中的一项重要研究课题,本文阐述了一个中文文档自动分类系统的设计与实现,并着重介绍了系统实现中的一些主要技术问题的处理,如文本分类模型,特征提取
一、物资总公司多种经营的特点和存在的问题 (一)特点一是以商贸经营为主。其中成品油经营又占主要地位。商贸企业数量占84%;商贸总值占多种经营总值的98%。在商贸总值中,油
四川石油管理局输气公司的多元开发业目前已形成了一定规模,但产权关系不清已成为影响投资回报、结构调整、集团化格局构建以及经济效益的重要问题之一。化解产权矛盾、理顺
一、加强产权管理是深化企业改革的必然要求17年来企业改革实践证明,国有企业缺乏活力、效益低下的根本原因是在计划经济体制下其生产经营活动受制于行政权力,忽视了产权制度
多字体特大字符集字符识别是当前OCR技术研究的热点之一。本文利用一组在抗干扰和描述字符拓扑结构方面具有互补性的特征,基于Support Vector技术和可增长自组织神经网络模型,建立一种识别系统
本文提出了一种基于语音分段辨认序列信息的与文本无关的说话人确认方法,并且着重分析了其中关键因素的变化,包括聚类数、阈值以及判定准则的变化,对确认效果的影响。通过实验证
地形图的自动扫描矢量化是GIS领域亟待解决的一个重要难题。地形图中包含了大量的字体丰富的数字注记 ,用以表示地物地貌的属性等特征 ,正确提取并识别这些数字是图纸处理中的重要组成部分。本文分析了现有的提取方法的不足 ,提出了一种新的数字注记自动提取与识别算法 ,首先根据先验的尺寸大小确定候选数字 ,再采用OCON结构的BP神经网络识别出真正的数字 ,然后利用近邻关系提取出扩展数字。实验表明 ,该算法
全国石油石化行业两大集团公司实行政企分开、重组和企业化运作后,集团公司内部石油企业的体制改革问题就显得十分突出。特别是在目前国内油气资源储量逐年下降导致供需