搜索引擎中中文分词的研究

来源 :电脑知识与技术 | 被引量 : 0次 | 上传用户:delphi_quaker
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:针对目前最常用的分词算法——最大匹配算法效率低,长度受限等缺点,在对中文编码体系和中文分词的算法进行研究的基础上,提出了一种新的词库数据结构。它支持首字Hash和标准二分查找,而且不限制词条的长度。然后介绍了基于该词库设计的一种快速的分词算法,并给出了算法的实现过程。
  關键词:中文分词;二分查找;Hash;词库;搜索引擎
  中图分类号:TP391 文献标识码:A 文章编号:1009—3044(2007)08—20435—02
其他文献
摘要:介绍了无线传感器网络的基本原理,阐述了无线传感器网络的特点;分析了802.15.4協议的基本技术要点;给出了无线传感器的设计方案,分别从处理单元,通信单元,传感器单元和电源单元分析了设计思想。从工程实际出发,从器件的选择,接口方式,测试方法等方面实现了设计的全过程。列举了一些无线传感器网络的典型应用。  关键词:无线传感器网络;802.15.4协议;低速率;低功耗  中图分类号:TP393