基于数据量的文本分词算法选取的研究

来源 :福建电脑 | 被引量 : 0次 | 上传用户:wdq007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
分析了无词典分词及最大匹配快速分词算法的特点,并针对大数据量和小数据量两类文本,对两种算法进行性能测试。结果表明,两种算法均适用于大数据量的文本分词。此外,对无词典分词算法加以改进,使之也适用于小数据量的文本分词.并通过仿真实验验证改进的有效性。
其他文献
摘要:本篇文章首先对加强示范院校建设的作用进行阐述,从建设会计数据披露不完善、示范院校建设会计核算较为混乱、示范院校建设财务审计监督缺少体系三个方面入手,对示范院校建设中财务管理存在的问题进行解析,并以此为依据,提出示范院校建设财务管理的创新与实践对策。希望通过本文的阐述,可以给相关领域提供些许的参考。  關键词:示范院校;建设;创新;实践  院校的建设质量将会给学校今后发展带来直接影响,同时关联
摘要:在国家发展过程中,对社会保障统计的重视程度逐渐提高,传统的社会保障统计与新时代的发展已经不相适应,因此,加快社会保障统计的转型步伐是非常有必要的。本文就社会保障统计现状进行了分析,并提出了具体的转型对策,以供参考。  关键词:社会保障;统计转型;对策  社会保障是一个国家综合实力的一种体现,社会保障的与时俱进,代表着国家的繁荣昌盛,而随着社会保障的发展,社会保障统计也应随之发生改变。社会保障
Windows2000是Microsoft公司推出的划时代的操作系统.具有稳定、安全、节省管理成本等众多先进特性。随着Win2000用户的日益增多.也出现了不少操作中的问题。而许多问题是在启