多次Hash快速分词算法

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:xiaoshancx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
中文分词是中文信息处理的一个重要的组成部分。一些应用不仅要求有较高的准确率,速度也是至关重要的。通过对已有分词算法的分析,尤其是对快速分词算法的分析,提出了一种新的词典结构,并根据新的词典结构提出新的分词算法。该算法不仅实现对词首字的Hash查找,也实现了词的其它字的Hash查找。理论分析和实验结果表明,该算法在速度上优于现有的其它分词算法。
其他文献
东洲区位于抚顺市东北部,区域面积604平方公里,其中农村区域面积553平方公里。农业主要包括哈达镇、兰山乡、碾盘乡、章党镇共50个行政村。全区农业人口5.6万人,耕地面积13万亩。  根据我区的实际情况,按照党的十八大会议精神,构建现代农业科技体系建设,努力从生产型农业向消费型农业发展,依托原有的产业技术基础,提出建设“百千万”(百亩冷棚香瓜、百亩草莓立体栽培、千亩有机水稻、千亩生态采摘旅游基地、
从计算机集群系统实际应用出发,首先对Java线程的状态进行了分析,介绍了目前Java线程迁移机制的几种实现方法:处理源代码、处理字节码和扩展Java虚拟机的实现机制.从3个不同的
基于曲线演化的图像分割模型在分割目标时需要在目标附近人为地构造一条曲线作为初始曲线,在此基础上进行演化得到目标边界。当初始曲线离目标边界较远时,影响模型分割的效率;当初始曲线离目标边界很近时,意味着需要过多的人为操作,这使得其时间效率较低且易出错。为此,在非线性扩散滤波的基础上,给出一种半自动初始曲线构造方法,该方法首先利用AOS算法对图像进行非线性扩散滤波,再利用区域信息快速地得到离目标边界很近
【摘要】多年的教学实践使笔者深深地体会到作为物理教师,要想学生很好地掌握物理规律就必须创设物理环境使学生置身于物理世界中,从中发现问题,进而提出可以探究的问题。笔者根据教学实践从实验、生活中的现象、复习旧知和利用物理史或生活中的故事这四个方面来创设物理情境,激发学生探究的欲望。  【关键词】物理规律;物理情景   物理规律是物理基础知识中最重要的内容,是物理学知识体系的中心。学生只有掌握了物理规律
目前,J2EE体系结构已经成为开发电子政务系统的主流平台。剖析了J2EE重量级与轻量级开发平台的优缺点,对目前流行的开源框架WebWork、Spring、Hibernate进行分析,结合政府电子采
【摘要】《3~6岁儿童学习与发展指南》(以下简称《指南》)强调了家园共育的教育理念,我园在贯彻《指南》、寻求家园共育的有效途径中,尝试融入家园协同教育理念,形成幼儿园、家庭教育合力教育。本文抓住幼儿园建立亲子小书架这个契机,引导家长参与到幼儿园亲子小书架的建立、管理中来,通过家长的亲身参与与体验,逐步认同亲子共读的理念,与幼儿园进行良好的合作。  【关键词】亲子小书架;亲子共读;家园协同教育  《
为适应不同规模的网络管理,提出了一种基于分布式域的综合网络管理体系,它采用多层架构,在底层域的基础上引入层次型的域管理机制,从而将传统的集中式处理模式转变为多层次分布式
约束处理是约束优化的关键问题,特别是非线性约束的处理一直缺少特别有效的解决方法,将惩罚函数法与修复策略结合使用,可以有效地避免迭代过程中大量非可行解的产生,使得约束优化
目的探讨亚低温治疗对中重度新生儿缺氧缺血性脑损伤的安全性。方法将23例中重度缺氧缺血性脑病新生儿随机分为治疗组14例和对照组9例。治疗组采用选择性头部降温方法,使新生
活动目标:1.利用自然物测量影子,初步把握首尾相接的测量方法。2.通过阅读、测量、记录对影子的变化产生兴趣,初步发现影子与光的关系。活动重点:利用自然物测量影子的长短。