基于双数组的逆向匹配分词算法在保密技术检查中的应用初探

来源 :第二十四届全国信息保密学术会议(IS2014) | 被引量 : 0次 | 上传用户:htech888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
保密部门需要加强网络保密检查,通过搜索涉密信息及时发现和阻止泄密行为.信息搜索需要用到中文分词技术,对于输入的一段中文,高效、准确进行中文分词,有助于提高搜索涉密信息的效率和准确性.为提高分词准确率及分词速度,在双数组的词典结构基础上,提出一个基于双数组的逆向匹配分词算法,该算法结合了双数组和逆向匹配的优点,在词典结构上继承了TRIE索引树逐字匹配的特点,能节省空间,提高查询效率.实验结果表明,这种结合了双数组逆序词典结构和逆向匹配的中文分词算法具有较高的分词准确率及分词速度.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
引言近年来交通量和载重量的迅速增加,不断对工程师提出精心改进路面分析和设计方法的新要求。通常使用两种类型的路面。柔性路面是不同层次有着不同材料的多层体系,通常把
在对应用系统进行风险评估的过程中,通过系统安全功能验证、软件安全漏洞分析,并将渗透性测试作为风险评估过程中的一个重要步骤,设计了应用系统渗透测试的流程及方法,并将其
1960年6月12日下午5时,青岛市某工厂突然发生了急性胃肠炎。当日下午8时以后,工人中急性胃肠炎患者大批出现。13日作者等至该厂进行了流行病学调查。当日取得12日午餐的墨鱼
桃树冬剪技术一般将主枝的延长枝剪去顶端的1/3左右,主枝与主枝间距要保持80—100厘米,若树势衰退时,还须加重修剪。长果枝保留的侧枝长度以25厘米为宜,剪去顶部即可,若长果
泰国山麓地区的巴拉巴按蚊和微小按蚊是主要传疟媒介,经过几年的杀虫剂喷洒仍未能阻断疟疾传播。为此在北部山麓地区观察了两种媒介对滞留喷洒的反应。1970年7月到1972年3月
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
根据谢楊二氏的调查,天津市的蚊种以淡色库蚊为最常见,成蚊多在地下室、地壠或花房等处越多。目前,国内关于消灭蚊虫的研究很多,但对杀灭越冬成蚊的研究较少。为了了解成蚊
随着高清视频会议系统技术的成熟,视频会议系统已经越来越多的在重要信息系统中使用,其在大幅提高工作效率的同时也带来了一定的安全保密风险.本文首先介绍了视频会议系统的
美国政府在定密管理方面有2大特点:一是定密管理细化到流程控制和方法定义;二是定密操作细化到单条信息.以美国家安全局(NSA)为例,除了国家基本法律、总统行政命令和NSA部门