基于Lucene的中文分词技术研究

来源 :电脑编程技巧与维护 | 被引量 : 0次 | 上传用户:zbbankcomm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了现有的几种中文分词的算法,提出了在逆向最大匹配算法的基础上结合语义理解的分词方法,利用最大概率分词的方法解决多种分词结果的问题,以此来改进Lucene[1]的中文分词的算法,提高了分词的速度和准确性。
其他文献
思想政治素质教育是高校人才培养中最重要的内容,加强大学生的思想政治教育是当前高等学校一项长期而艰巨的任务。从人本主义的理念出发,融入高校思想政治理论新课程改革的思
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
<正> 红星是我国苹果主栽品种之一,其品质好,经济价值高,然而,初果期产量低是生产中尚未解决的问题。造成低产的原因很多,座果率低是主要因素之一。据1988—1990年在太谷、祁
桃小食心虫对苹果品种的生态选择曹克诚,李夏鸣,徐宇兴,郭栓凤(山西果树研究所&#183;太谷&#183;030800)随着农村种植业结构的调整,果树发展速度位居各种经济作物之首。果园面积扩大,品种更
随着我国图书情报事业的飞速发展,计算机数据传输远程网络越米越多地被应用到图书情报部门(主要应用于联机检索),而调制解调器又是计算机网络不可缺少的数据传输设备。为了让
<正>近几年来,我地柑桔园部分桔树出现黄化现象,导致树势衰弱,大量减产,严重者造成枯枝、死树.为此,1989—1992年,我们对黄化桔树进行了调查,现将调查结果报道如下.一、黄化
企业拥有的资源是企业长期发展和竞争优势之源。但在提高竞争优势的过程中,企业的资源能力是如何起到了作用,它与可持续竞争优势之间的影响关系到底如何,至今仍是一个因果模
据国外媒体报道,IBM公司与总部位于荷兰的Astron组织,正在计划打造一个亿亿次级(Exascale)的计算机系统,以期成为世界上最大、最敏感射电望远镜阵列的数据处理主干网。随着全球各
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield