【摘 要】
:
随着互联网技术的发展,网络空间安全形势也日益严峻,严重影响国家安全和社会稳定。构建面向网络安全领域的知识图谱,可以从海量碎片化的网络安全数据中挖掘出有价值的安全信息,进一步帮助决策者分析网络安全事件。其中,实体抽取技术是知识图谱构建中的重要一环,而现有网络安全领域实体抽取技术相关的中文数据集稀少,本体模型定义不够全面,实体抽取效果仍有待提升。因此,本文主要对网络安全领域知识图谱构建技术中的实体抽取
论文部分内容阅读
随着互联网技术的发展,网络空间安全形势也日益严峻,严重影响国家安全和社会稳定。构建面向网络安全领域的知识图谱,可以从海量碎片化的网络安全数据中挖掘出有价值的安全信息,进一步帮助决策者分析网络安全事件。其中,实体抽取技术是知识图谱构建中的重要一环,而现有网络安全领域实体抽取技术相关的中文数据集稀少,本体模型定义不够全面,实体抽取效果仍有待提升。因此,本文主要对网络安全领域知识图谱构建技术中的实体抽取技术开展研究,具体工作和创新内容如下:第一,设计了网络安全领域的本体模型。本文参考了结构化威胁情报表达STIX2.0和统一网络安全本体UCO1.0,并结合了实际的网络安全文本的实体类别构建了包括攻击方式、防御措施、恶意软件、软件、攻击者、漏洞等网络安全领域本体。第二,搜集大量网络安全领域文本数据并构建了相关数据集,以解决网络安全领域实体抽取任务数据集稀缺的问题。本文构建了爬虫自动化爬取网络安全文本,并进行清洗,同时建立了网络安全词典,然后根据网络安全本体模型对数据进行人工标注,构建了网络安全语料训练数据1万余条。第三,提出了Security BERT-SWLE-Bi LSTM-Att-CRF实体抽取模型。首先模型针对网络安全领域进行预训练,得到Security BERT模型。其次提出了网络安全词级增强(SWLE)方法,融合了词语级信息,提高实体边界确定和实体识别能力。接着引入Bi LSTM模型和自注意力机制来捕捉上下文语义和增强局部关键信息。最后使用CRF模型进行序列标注实现网络安全实体抽取。第四,针对单任务实体抽取中标签分类多、实体识别不准确的问题,本文借鉴了多任务学习的思想,在单任务模型基础上,提出了多任务联合学习模型。该模型同时进行实体分词以及实体类别判断任务,最后在输出层进行标签融合。实验结果表明,本文模型相比其他传统方法在精确率、召回率和F1值上取得最佳效果,能有效地从网络安全文本数据中抽取网络安全实体。
其他文献
增殖失控是肿瘤细胞区别于正常细胞的显著特征之一,在肿瘤的发生和发展中起关键性作用。研究表明,一些细胞周期激活蛋白(如E2F1)的过量表达和活性增强能促进肿瘤细胞的无限增殖。PIR(Pirin)属于cupin超家族,在真核生物和原核生物之间高度保守。我们从Oncomine数据库发现PIR在多种肿瘤(尤其是乳腺癌)中异常上调,表明PIR可能在肿瘤发生中起一定作用。然而,迄今为止尚不明确PIR是否及怎样
背景:中华眼镜蛇是我国常见的剧毒蛇之一,其咬伤中毒可导致咬伤部位皮肤和皮下软组织红肿、疼痛与坏死。蛇毒进入机体后可引起机体多个器官系统的病理改变,可导致MODS(多器官功能衰竭综合征)进而危及生命。中华眼镜蛇毒素中主要含细胞毒素、磷脂酶A2等,主要成份为蛋白质和多肽类;其一次咬物排毒有效成分约为79.1mg。目前关于中华眼镜蛇的研究大多偏向于蛇毒成分及临床治疗方面,对于中华眼镜蛇咬伤中毒的临床动物
自“中国制造2025”提出到现在,我国逐步成为全球最大的工业机器人市场,“机器代人”在提升我国制造业水平的进程中所占据的地位越来越高。与此同时,对于机器人的了解使用及相关的操作技术人员的培训需求不断扩大。为了提高效率,缓解实物培训的高代价成本,本文在现有机器人仿真研究的基础上,结合虚拟现实技术,基于Unity3D开发搭建一个工业机器人虚拟示教学习与加工仿真系统。主要研究工作如下:(1)根据D-H参
点胶技术作为微电子封装行业的核心技术,对电子行业的快速发展有着突出贡献,点胶技术的快速发展极大地推动了电子产品特别是3C产品的发展进步。点胶技术中的压电喷射式点胶技术在目前已经成为绝大多数电子封装的首要选择,压电喷射式点胶有着极高的点胶工作效率和优异的点胶效果。压电喷射式点胶技术目前正处于高速发展的阶段,方兴未艾,有着很好的发展前景。针对现有的压电喷射式点胶阀大部分依赖传统弹簧进行压电陶瓷的预紧,
随着经济全球化的发展,世界经济网络变得越来越复杂,关联度越来越高。2008年金融危机波及全球后,各国监管机构为了维护金融系统的稳定,把金融系统作为一个复杂网络并将系统性风险作为宏观审慎监管的重点成为新的共识。金融危机后,世界各国相继出现流动性危机,中国金融系统中流动性危机也时有发生。党的十九大后,基于国家的安全稳定和长期战略的发展,我国将站在一个新的高度去重点预防和化解系统性金融风险,保持金融系统
随着物联网技术的发展,物联网软件的复杂化,由于物联网软件供应链中组件复用而产生的安全问题层出不穷。而如何构建物联网软件供应链中的组件关系网络,对于分析物联网软件供应链安全有着重要的意义。由于物联网组件可编译于不同架构,给物联网组件关系构建中组件的版本引用关系分析与组件的同源关系分析这两方面带来了一定挑战。对于组件版本引用关系分析,编译架构不同,导致物联网组件指令集相异、指令逻辑语义表达方式不同,使
随着电子信息技术的发展,我国封闭列举式合理使用制度逐渐难以应对电子信息技术环境下出现的新型作品利用方式。在司法实践中已经出现数起适用国内尚未有相关规定的转换性使用理论来应对新型作品利用带来的纠纷案例。特别是自谷歌数字图书馆案在我国审判之后更是引起了诸多学者对转换性使用问题的探讨。然而由于对转换性使用理论缺乏理解使得现有的部分观点是片面的,例如部分学者将转换性使用与合理使用、转换性使用与演绎行为混淆
随着我国综合实力的提升,经济的高质量增长是经济发展过程中的首要目标。建设丝绸之路经济带是新时代我国经济发展和对外开放的重要战略,丝绸之路经济带地处我国内陆地区的西部边陲,同时与多个国家接壤,有着独特的地理优势。近年来国家提出的西部大开发战略,使经济实现了快速增长:地区生产总值由2012年的90470.99亿元增长到2018年的150728.83亿元。而经济的快速增长,会造成自然资源过度开发利用、产
近年来,阿尔兹海默症、帕金森等中枢神经系统疾病的发病率一直居高不下,严重危害到人们的健康。伴随着疾病的治疗,后加工的化学合成药物对人体的副作用也不容忽视,因此,加工少、低副作用的天然保健型药物越来越受人们青睐。蜂王浆就是这样一种历史悠久、药食同源的天然保健品,它的药物功效具有广谱性,连续服用蜂王浆可提高机体免疫力、降压降脂、促进新陈代谢,在心脑血管疾病甚至是抗肿瘤方面都有很好的疗效。然而,蜂王浆的
本文以海南省三亚市蜈支洲岛典型珊瑚礁区为研究区域,于2018年8月、11月、2019年1月和4月采用样带法调查浅水区和深水区棘皮动物群落多样性,研究不同季节和深度对棘皮动物群落结构特征的影响,并依此指示珊瑚礁生态系统健康状况和受干扰程度;然后,于2019年1月~9月采用固定样方法结合水下摄像研究红腹海参和绿刺参种群分布,生境斑块偏好;通过对比两种海参肠含物与沉积物粒度与有机物含量组成情况,分析两种