【摘 要】
:
网络文本已经成为互联网上网络空间安全信息的重要载体,这些文本不仅包括最新的安全事件,如漏洞利用、数据泄露以及黑客攻击等,还包括大量的安全知识,如安全博客论坛、网络空间安全知识平台等。通过整合大规模、异构、非结构化的网络空间安全信息,对网络空间安全信息进行实体关系抽取,可以有效地掌握网络空间安全知识,辅助网络空间安全问题的解决。本文基于互联网公开的网络空间安全数据,主要研究网络空间安全命名实体识别和
论文部分内容阅读
网络文本已经成为互联网上网络空间安全信息的重要载体,这些文本不仅包括最新的安全事件,如漏洞利用、数据泄露以及黑客攻击等,还包括大量的安全知识,如安全博客论坛、网络空间安全知识平台等。通过整合大规模、异构、非结构化的网络空间安全信息,对网络空间安全信息进行实体关系抽取,可以有效地掌握网络空间安全知识,辅助网络空间安全问题的解决。本文基于互联网公开的网络空间安全数据,主要研究网络空间安全命名实体识别和实体关系抽取任务。由于网络空间安全领域文本的复杂多样性,传统的命名实体识别方法难以用于识别网络空间安全实体,此领域研究尚处于起步发展阶段。针对目前网络空间安全领域实体识别的难点,本文提出了一种将数据驱动的深度学习方法与知识驱动字典方法相结合的模型Bi LSTM-DIC-ATT-CRF。实验结果表明,在公开的网络空间安全数据集上,本文所提出的方法优于其他方法,可以更有效的提取网络空间安全实体。在基于网络空间安全命名实体识别的基础上,进行网络空间安全知识的关系抽取,针对关系抽取中所面临的三元组重叠问题,本文提出了一种基于关系分解的实体关系联合抽取方法。该模型主要包含三个模块:编码器模块、关系抽取模块和实体识别模块。输入文本首先经过编码器模块生成文本词向量表示,然后对得到的文本词向量进行池化降维,从而得到文本句向量表示。此外,引入注意力机制来捕获不同单词对句子分类的重要程度。通过将这两者结合得到新的文本句向量,在关系抽取模块进行多关系分类。最后,将特定关系向量与文本词向量进行组合,在实体识别模块识别特定关系下的实体,从而生成三元组。实验结果表明,所提出的模型有效的解决了三元组重叠问题,提高了关系抽取的性能。
其他文献
由于传统污水处理工艺很难将常见抗生素三氯生(TCS)完全降解,使得污水处理系统出水和地表水中频繁检测出它的存在。针对此问题,本文选择紫外光(UV)照射活化过硫酸钠(PS)对水中TCS的去除进行研究,并将Cu改性活性炭作为催化剂引入UV/PS体系,以期获得更好的TCS的降解效果。主要研究内容及结论如下:首先,本文考察了TCS初始浓度、PS投加量、初始p H、反应温度和腐殖酸(HA)投加量对UV/PS
纳米银(Silvernanoparticles)作为应用最广泛的纳米材料之一,会通过各种途径进入水环境,对水域生态环境健康产生潜在影响。虽然已有大量关于纳米银对水生生物的毒性效应报道,但纳米银对水生生物的持续毒性效应仍鲜为人知。为此,本文以大型溞(Daphnia magna)为受试生物,分别设置24h暴露阶段和24h恢复阶段,选用了两个粒径纳米银(AgNPs-10 nm、AgNPs-70nm),并
随着“一带一路”政策不断推广,昆明市身为中国和东南亚地区连接的桥梁,在近两年取得了非常大的发展。而深入探究昆明市土地利用/覆被变化(LUCC)的相关知识,进而推导出昆明市未来一段时间内的变化规律,模拟其动态变化过程,则可赋能昆明市可持续发展。本文首先以昆明市为研究区,借助RS与GIS技术,结合中科院土地利用数据和以中国知网经济社会大数据研究平台和NASA为代表的众多公开数据平台的数据,对于昆明市L
在当今互联网信息爆炸的时代,如何为用户提供个性化的推荐,实现信息的高效传递,成为了目前推荐系统研究最为关注的问题。在推荐系统中合理地融入社交网络,评论数据、热点数据等辅助信息可以有效提升模型的性能。近年来,结合知识图谱进行推荐的研究引起了工业界和学术界的广泛关注。通过探索推荐场景知识图谱中实体之间的潜在联系,能够为物品推荐提供丰富的语义信息。然而,现有的大部分研究无法有效地建立起推荐模型与知识图谱
冬半年南支槽是影响我国南方降水的主要天气系统之一。本文主要使用NCEP-DOE R II再分析资料、ERA-Interim再分析资料、中国气象局台站降水资料,通过普查近十年(2009年-2018年)冬半年(10月-次年5月)南支槽影响我国南方降水事件,将南支槽影响我国降水的事件主要可以划分为三种类型,分别为:(1)南支槽稳定维持(在孟湾北部区域),影响西南地区降水;(2)南支槽东移,影响华南地区降
为了解新疆动物源产CTX-M大肠埃希氏菌携带的CTX-M基因亚型和多重耐药性的特点,采用PCR方法检测新疆猪、牛、羊、骆驼、马、鸡、鹅、鸽、犬和猫源产CTX-M大肠埃希氏菌的CTX-M基因亚型(blaCTX-M-1、blaCTX-M-2和blaCTX-M-9亚群),利用K-B纸片法对产CTX-M大肠埃希氏菌进行药物敏感性检测。结果显示,在148株产CTX-M大肠埃希氏菌中,blaCTX-M-1亚群
视觉目标跟踪算法是研究在给定的一个连续的视频帧中,标注好第一帧中需要跟踪的目标的大小及位置,之后利用算法去预测后续帧目标所在的位置,从而得到目标的运动轨迹。该技术为视频序列的分析和理解提供了重要的依据和基础,并且在生活中有着广泛的应用。如:在军事领域部分包括无人飞行器(UAV)、精确制导(PGW)、空中预警(AEW)、战场监视(BSL)等;生活常见方面包括移动机器人((AMR)、智能视频监控(IV
太赫兹功能器件的设计是近年来备受关注的研究热点,在吸收、调制、滤波和慢光领域均表现出了非凡的应用价值。本文以传统的三明治结构为设计基础,以智能化的功能需求为出发点,循序研究了针对太赫兹波的单可调、双可调和可重构的超材料吸收器件。将石墨烯,二氧化钒等主动可控材料与传统结构相结合,根据不同的通信场景设计出了一系列的太赫兹超材料功能器件。利用阻抗匹配理论、传输线理论和干涉理论深入分析理解了所设计器件的工
目的 对1株同时耐头孢菌素和阿奇霉素的多重耐药宋内志贺菌进行全基因组测序分析,明确其携带的耐药基因和质粒特征。方法 通过对2011年上海市的60株宋内志贺菌进行抗菌药物敏感性分析,筛选出1株同时耐头孢菌素和阿奇霉素的菌株Sh11sh529,使用二代和纳米孔测序技术获得其基因组序列,分析基因组的耐药基因、质粒、可移动遗传元件等。结果 Sh11sh529基因组中检测到了11个耐药基因以及gyrA基因喹
地震是地壳变形导致的严重自然灾害。监测地表形变是研究地震活动的重要内容之一。合成孔径雷达干涉测量(InSAR)技术可全天候、全天时成像且分辨率较高,在地表形变监测尤其是单一对象、局部地区和裸露区的地表形变监测中已得到广泛应用,但在地震多发区和植被覆盖区,其适用性如何少见研究。云南盈江地区是中国西南部地震最为频发的地区之一,植被覆盖浓厚,形变监测研究亦未见深入探讨。基于此,本文以盈江地震多发区为研究