【摘 要】
:
[目的/意义]网络安全形势日益严峻,从威胁情报中抽取网络安全实体及其关系,构建结构化威胁情报信息,对于网络安全防护来说尤为重要.在过去的工作中嵌套实体的关系抽取一直是难点,嵌套实体和关系重叠不能被有效识别导致准确率低,为威胁情报信息抽取研究带来巨大的挑战.[方法/过程]基于上述情况,针对嵌套实体关系抽取过程中存在的问题,本文基于图注意力网络提出了一种新型知识抽取模型SRG.采用Bert-Bi-LSTM作为共享编码层,与边界检测模块所得的多跨度实体共同进行跨度表示后,利用图注意力网络提取特征进行关系抽取,可
【机 构】
:
北京信息科技大学 北京 100192
论文部分内容阅读
[目的/意义]网络安全形势日益严峻,从威胁情报中抽取网络安全实体及其关系,构建结构化威胁情报信息,对于网络安全防护来说尤为重要.在过去的工作中嵌套实体的关系抽取一直是难点,嵌套实体和关系重叠不能被有效识别导致准确率低,为威胁情报信息抽取研究带来巨大的挑战.[方法/过程]基于上述情况,针对嵌套实体关系抽取过程中存在的问题,本文基于图注意力网络提出了一种新型知识抽取模型SRG.采用Bert-Bi-LSTM作为共享编码层,与边界检测模块所得的多跨度实体共同进行跨度表示后,利用图注意力网络提取特征进行关系抽取,可有效改善实体边界信息与类别信息的检测效果.[结果/结论]在公共数据集上进行了实验验证,验证结果表明,其在解决实体嵌套与关系重叠的问题上有显著的效果.
其他文献
[目的/意义]在关系抽取的研究领域中,通过远程监督方法可以快速地获取大量标注好的训练数据,但是其存在的关系标签错误标注问题会引入大量噪声数据.已有的研究工作主要使用注意力机制来降低噪声数据的影响,但这种方法在注意力分配时使用的是含有噪声的关系标签,可能导致“越学越错”的问题.[方法/过程]本文提出了一种融合多头自注意力的远程监督关系抽取方法,在词级别注意力分配上,使用多头自注意力计算并分配权重,在句子级别注意力分配上,使用头、尾两实体的语义表征作为权重分配的依据,从而避免采用有噪声的关系标签作为注意力分配
两段式发酵工艺是以纤维素降解菌HIT-3的纤维素降解产物作为絮凝菌F2的代谢底物,发酵得到优良的复合型生物絮凝剂.第一段发酵工艺中的糖化过程产生的还原糖可以替代培养基中的葡萄糖,还原糖得率12.1%;絮凝菌利用还原糖发酵产生生物絮凝剂,絮凝率为82.1%.絮凝菌可以较好的利用糖化产生的还原糖,拓展了生物质资源的高效综合利用途径.
数字经济时代,作为承载着国家经济高质量发展引领作用的长三角地区,借助数字经济提升产业结构合理度,是完成国家长三角一体化发展战略的重要保证.本文利用2014-2018年长三角地区41个城市的面板数据,运用空间自滞后模型,对数字经济影响长三角地区产业结构合理化的状况进行了实证分析,研究发现长三角地区数字经济能够为长三角地区产业结构合理化带来积极的推动作用,但在数字普惠金融方面,未能在相邻城市产生显著的空间外溢效应.在省级层面,浙江省各城市的数字经济能够给相邻城市带来产业结构的合理化,但是对自身产业结构合理化却
合理的旅游开发可以为非物质文化遗产带来生机,非物质文化遗产旅游开发潜力评价为非物质文化遗产旅游开发提供决策基础.文章在梳理相关文献基础上,构建了非物质文化遗产旅游开发潜力评价指标体系,运用层次分析法确定指标权重,并且结合各评价元素的模糊打分数据对苏州市姑苏区国家级非物质文化遗产旅游发展潜力进行了综合测算.研究结果表明:桃花坞木版年画和昆曲的潜力等级为Ⅱ级,苏州御窑金砖制作技艺、庙会(苏州轧神仙庙会)、苏州评弹(苏州弹词、苏州评话)的潜力等级为Ⅲ级,整体旅游开发潜力较大.结合旅游开发潜力的评价结果,还提出了
本研究主要探索锌转运蛋白8(ZnT8)/溶质载体家族30成员8(SLC30A8)在胰腺癌的发生和发展中的作用.利用cBioPortal平台分析癌症基因组图谱(TCGA)数据库资料中胰腺癌患者的SLC30A8基因的拷贝数变异和突变情况、患者的预后生存情况、共表达基因;利用DAVID平台进行功能富集分析得到共表达基因的GO功能分类条目;通过STRING数据库分析蛋白质相互作用.结果 发现,SLC30A8在患病人群中遗传发生改变的占9%;在总体生存期,无进展生存期和疾病特异性生存期中SLC30A8遗传改变组的生
[目的/意义]中国科学院作为我国最高学术科研机构,一直活跃在国际科技前沿.本文以中国科学院官方微博为例,探究其官方微博“中科院之声”在微博平台的知识传播现状,把握知识传播过程中的主题和热点,发现知识话题的传播规律和特征,分析微博评论情感倾向,为科学知识的网络化传播提供建议和参考.[方法/过程]本文选取自“中科院之声”成立以来2013—2020年间发布的微博文本数据,结合内容分析、词频分析等对目前发展的情况进行梳理,并以微博评论为对象,建立情感分析规则,探究了该机构在微博平台进行知识传播过程中的受众情感倾向
云平台部署的云盘虚拟机是用户数据和业务的载体,当用户对数据安全性要求较高时,一般采用加密的方式,提高云盘数据的安全性规避数据泄露风险.除了安全性,业务性能也同样是用户非常关注的地方,但对于云盘加密后带来的性能损耗情况,各大云厂商却没有明确的数据说明.本文选取了主流的三家云厂商,对他们的加密云盘性能做了多轮的模拟业务测试.通过对比分析云盘在加密和非加密应用时的性能损耗情况,对用户关注的云盘性能给出量化说明及影响分析.
[目的/意义]探究影响网络舆情反转的因素能够对于网络舆情事件发展有更深层次的理解,避免或减少发生舆论反转事件,促进社会和谐.[方法/过程]根据新闻传播主体“三元”类型结构,选取“菲妥妥-穆修修”事件当事人、主流媒体的微博及网民评论,基于BiLSTM-Attention模型对网民情感分类,划分舆情发展的阶段.以情感分类和关键词提取的方式对舆情发展过程中情感极性变化以及当事人回应、主流媒体及微博大V的发声对网民情感的影响进行动态分析,再选取“三元”传播主体均发挥作用的“双黄连抑制新冠病毒”事件与“菲妥妥”事件
英国将计算课程纳入中小学国家必修课程体系,意在通过全民计算思维培养保持其全球数字经济的竞争优势.ScratchMaths项目正是在这一背景下展开.文章将详细介绍英国Scratch-Maths项目,剖析项目设计内容与实施过程,寻求其跨学科深度融合研究的借鉴价值和意义,以期在我国新一轮课程改革以及国家号召在中小学推进编程教育的背景下,能够为我国基础教育领域计算思维培养理论和实践的研究提供国际经验借鉴.
[目的/意义]随着全球人工智能竞争日趋激烈,智库在支撑各国人工智能发展战略决策中的重要性不断被提升.在此背景下,梳理我国人工智能智库发展现状,分析其发展面临的问题,对于提升智库影响力和决策支撑力具有重要意义.[方法/过程]选取智库发挥功用的关键制约因素——智库成果与影响渠道,作为两大分析维度,通过网络调研、词频分析等方法对20家国内主要的人工智能智库展开分析.[结果/结论]国内人工智能智库发展整体趋势向好,诸多综合型智库在人工智能领域投入研究,专业型人工智能智库也快速涌现,智库产出了众多类型的研究成果,普