基于自然语言处理的文本泄密自动检测技术

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:xsw2233
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因文本信息泄密导致的危害越来越严重,但传统的泄密检测还停留在人工查看,效率低且易造成二次泄密。针对以上问题,采用文本相似度自动比较和数据加密方法,提出了一种基于自然语言处理的文本泄密自动检测技术。在实际应用中,因检测粒度过粗可能导致漏检,采用基于自然段落和语句的相似度检测方法,方便疑似段落和语句的自动定位,最后设计并实现了一个文本泄密检测系统。实验结果表明,该技术能很好地应用于涉密文本泄密的检测,具有保密、人工干预少、效率高、疑似段落定位等特点。
其他文献
<正>土库曼斯坦拥有世界第四大天然气储量。2014年8月,在土库曼斯坦首都Ashgabad附近OvadanDepe已开始建设天然气转化为合成汽油装置。该装置将采用哈尔德托普索公司的TIGAS(
摘 要 目的:观察肌注病毒唑联合口服双黄连治疗青年急性上呼吸道感染的临床疗效。方法:将116名患者随机分为治疗组和对照组各58例。治疗组肌注病毒唑联合口服双黄连;对照组静脉滴注病毒唑注射液,主要观察临床疗效。结果:总有效率治疗组为94.82%,对照组74.14%两组比较,差异有显著意义(P<0.05)。结论:肌注病毒唑联合用口服双黄连对青年上呼吸道感染有显著的治疗作用。  关键词 急性上呼吸道感染
关键词 宫颈细胞 HPV病毒    自从1941年引入巴氏涂片作为宫颈癌的筛查方法以来,宫颈癌人群死亡率明显下降,然而巴氏涂片在技术上远远不能达到临床的要求,而且假阴性率及假阳性率均较高。在2001年4月液基薄层细胞(TCT)应用于临床以后,受到临床医生的重视,在TBS描述性报告分类法中,描述清楚,弥补了巴氏不足之处。虽说每年约有11万的新发病例,但大量证据显示人乳头瘤病毒(HPV)与宫颈癌的关系
2014年我国竞争情报专业组织成立20周年。为纪念竞争情报事业和分会走过的不平凡历程,宣传好行业创造的辉煌成绩,激励广大情报从业者更加热爱竞争情报工作,积极参与国家经济
关键词 微柱凝胶试验(MGT)配血聚凝胺法    资料与方法  检测对象:供血者为本市无偿献血者,受血者为本市各医院患者及各医院血库交叉配血出现不相合者。  试剂来源:微柱凝胶抗人球卡及专用离心机和孵育器由长春博讯公司提供,聚凝胺试剂盒Dominion Biologicals Limited提供。  微柱凝胶抗人球卡试验:将受血者和供血者血标本离心,受血者、供血者红细胞分别用生理盐水洗涤1次,配置
本文是笔者根据多年的施工经验,以大桥梁桩基施工为例,对钻孔灌注桩的施工技术进行了全面的介绍,希望同行工程技术人员能够从本文中得到启发。
维持性血液透析是治疗尿毒症的主要措施之一,而血管通路则是维持性血液透析患者赖以生存的生命线。动一静脉内瘘是临床最常见的血液透析血管通路。正确使用和保护动一静脉内瘘
为了解决模糊C-均值(FCM)聚类算法的固有缺陷,提出基于混沌粒子群的模糊C-均值聚类算法(CPSO-FCM)。针对FCM对聚类初始值的敏感度问题,辅以粒子群算法以避免随机选取的聚类数和聚
检察机关案件流程监控是案件管理部门实现对案件管理监督的重要职能。但现有的流程监控在监控主体、监控方式、监控效果等方面存在诸多问题,阻碍了管理监督职能的发挥。本文
当前,全国检察机关正在深入推进以司法责任制为核心的检察改革,功能不断丰富和完善的统一业务应用系统在推进改革进程、保障改革效果方面发挥着越来越重要的作用。本文结合重