论文部分内容阅读
网络上存在着大量的安全分析报告,研究如何从这些文本中自动提取出威胁情报相关信息,从而生成结构化威胁情报,对情报的分析和共享具有重要意义。文章引入了STIX标准中的主要威胁情报实体,标注了31篇APT报告并在此基础上对数据集进行了扩充,并利用自然语言处理中的命名实体识别方法抽取出文本中的相关短语。文章还对比了该数据集下不同抽取方法的效果,实验表明,该方法可以有效地从文本中抽取威胁情报实体,从而用于威胁情报的自动化构建。