双数组相关论文
分词词典是汉语自动分词系统的一个基本组成部分,词典的查询速度直接影响到分词系统的处理速度。在因特网上的中文文本检索、汉字......
随着信息量的急剧增长,大量的数据需要以字符串的形式存储,例如文档,网页,基因组数据等等,提高字符串的存储和检索效率具有非常重......
双数组是组织和实现Trie树的一种数据结构。双数组Trie树索引实现的是一种线性时间复杂度的搜索机制,因此被广泛的应用于信息检索和......
对双数组Trie树(Double—ArrayTrie)分词算法进行了优化:在采用Trie树构造双数组Trie树的过程中,优先处理分支节点多的结点,以减少冲突;......
业务选择网关(SSG)中的访问控制模块从用户请求数据包中解析出URL,并且根据用户的URL访问权限进行访问控制和路由选择。首先提出了改......
为了挖掘医药销售数据库频繁集,采用双数组穷举算法DAEA。该算法主要使用两个数组和穷举算法,实现挖掘医药销售数据库的频繁集功能......
海量数据中关键词高速检索对增强网络安全态势感知系统反应速度,提高系统整体效率和安全性具有重要意义。基于双数组Trie树的网络......
摘要:基于双数组Trie树的中文分词词典具有较高的查找效率,但其插入时间复杂度较高。为此提出了一种基于5iX数组Trie树结构的改进算......
从汉字编码和构造过程两个方面对双数组Trie树算法进行改进和实现。在编码过程中,按照汉字的深度由浅入深依次编码;构造字典时,按......
中文分词是汉语自然语言处理的基础性任务,分词的准确度直接影响到后续处理任务,分词的速度影响一些系统的实际应用。条件随机场(C......
本文对双数组Trie树(Double—Array Trie)算法提出了一种优化策略,即在采用Trie树构造数组的过程中,优先处理分支结点数更多的结点。这......
随着社会信息化的发展,无论是党政机关,还是公司企业学校,人们更青睐于用电子文档的形式来存储、备份文档。于是电子信息迅速增长......
网络的飞速发展吸引了越来越多的用户使用互联网,这些互联网使用群体通过互联网来获取信息、帮助决策,甚至解决自己生活所需。根据......
Internet的迅猛发展和电子商务应用的日益普及,越来越多的网络应用程序需要高效地对违禁用语、禁限售商品等关键字进行高效过滤和......