一种改进的基于海量智能分词的中文自动分词算法

来源 :第五届中国管理科学与工程论坛 | 被引量 : 0次 | 上传用户:H07081820607
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文提出了一种基于海量智能分词的中文自动分词新算法,该算法不依赖于现有词库,通过文本过滤和词频统计的方法进行中文自动分词,可以发现不限长度和不限领域的新词。自编软件进行的测试结果表明该方法有助于提高中文自动分词的准确度。
其他文献
目的:对9054例白银市企事业单位职工转氨酶、血糖、总胆固醇、甘油三酯、尿酸五项生化指标的检验结果及相关资料的收集、整理、统计、分析,初步评估白银地区城镇居民的健康状
目的:探讨三氯乙烯(TCE)变态反应病人外周血凋亡基因BA、BAD、Bcl-2、Caspase-3、Caspase-8及Caspase-9的mRNA表达水平变化情况.方法:抽取健康人(对照组)和三氯乙烯变态反应
修船厂财务股,三年来,在厂党委和首长的领导下,经过毛主席著作的学习和四好运动的推动,作风不断改进,工作不断提高,在深入实际,调查研究,面向生产,为生产服务方面做出不少成
目的:对广东省东莞市2010年首例输入性登革热疑似病例的标本进行快速诊断分型并对其部分核酸序列进行测序分析.方法:采用RT-PCR、PCR、基因测序技术对血清标本中的核酸进行检
The effect of different fermentation conditions on the anti-microbial activity of Pleurotus tuber-regium spent culture liquids was determined using Staphylococc
本文首先根据Nonaka的知识创造促进条件,说明了开源社区软件开发有益于知识创造的组织情境。从大教堂开发和敏捷开发中衍生出开源社区知识创造的十大原则,它们是自组织原则、
会议
新产品开发是一种知识创造的过程,而组织的学习能力则会显著地影响组织对知识的吸收、消化与运用。本文选取我国华南地区115家高科技企业作为实证对象,探讨组织学习、知识创
目的:选择对注射用阿莫西林钠舒巴坦钠的无菌检查法的最佳检查方法,保证检验结果的准确和可靠性。方法:采用中国药典2010年版二部附录无菌检查法项下薄膜过滤法。结果:确定了
目的:研究e抗原阴性慢性乙型肝炎患者外周血中HBV-DNA载量与乙型肝炎病毒表面抗原(HBsAg)以及反映肝脏损伤水平的肝功能指标天冬氨酸氨基转移酶(AST)含量的关系.方法:收集238
本文首先阐述了产生数据、信息和知识的信息空间概念,分析了信息空间中的学习周期,并以此为基础建立了学习模型,深入地从信息的编码、抽象和扩散角度分析了企业鉴别、获取及