基于文本挖掘的漏洞信息聚类分析

来源 :东南大学学报(自然科学版) | 被引量 : 0次 | 上传用户:junyan04
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了挖掘漏洞内在联系且高效管理漏洞信息,将文本处理和聚类算法应用于漏洞挖掘中.从漏洞库宏观角度出发,提出了一种基于文本挖掘和粒子群优化算法的漏洞信息聚类(PSO-Kmeans)算法.首先,通过文本处理,获取频词空间,用以将漏洞信息描述字段编码化;其次,为了减少局部最优和聚类中心选取不当对聚类结果的影响,利用粒子群优化算法获取全局聚类中心;最后,利用K-means算法实现漏洞信息的聚类,对漏洞信息进行分类别管理,并为预测未知漏洞特征提供参考.实验结果表明,PSO-K-means算法准确率达到90.16%,与K-means算法相比,其平均准确率提高约5%,平均迭代次数减少约45次.所提算法可预测3种未知漏洞的主要类别,是一种有效的漏洞分析方法.
其他文献
探讨了多点激励位移输入模型对跨断层桥梁的适用性,并针对包含永久地面位移的时程曲线在基线校正过程中存在的问题提出了一种改进的基线修正方法.利用该方法对集集地震中距发
报道了2个新异名,1个新等级和35种蕨类植物在广东的分布新记录。正安肋毛蕨(Ctenitis changanensis Ching)和信宜铁角蕨(Asplenium xinyiense Ching et S.H.Wu)分别作直鳞肋
紫杉醇(Paclitaxel,商品名Taxol)是一种在红豆杉科(Taxaceae L.)红豆杉属(Taxus L.)生长缓慢的常绿乔木中分离提取的天然化合物。卡铂和紫杉醇均是目前临床上使用率很高的抗
以茶树(Camellia sinensis)萌动芽为材料,根据茶树萌动芽芽抑制消减杂交文库中分离得到的肌动蛋白(actin)基因的5’-片段设计引物,利用3’-RACE技术克隆了其cDNA全长序列,该
凌汛灾害是黄河最难防御的灾害之一,突发性强,具有很大的不确定性。1949年以来,党和国家高度重视黄河防凌工作,通过不断完善防凌工程措施和非工程措施,大大减少了凌灾发生的频率。
儒家传统家训中蕴含不少生态伦理教化思想,如取用有度,珍惜资源;爱惜物命,乐善好生;随顺自然,不违自然之法等。在具体实践上采取了规范引导与严格践行相结合、填写"功过格"知
宽带网络通信技术的产生和多媒体应用的出现,要求计算机网络协议机制和控制策略进行相应的改进.本文首先概述了多媒体应用对路由选择的需求.在分析相关工作之后,提出了基于Hopfield 神经
广州市四部门联合发布《广州市发展绿色建筑指导意见》,明确提出绿色建筑发展阶段目标。本文根据广州市绿色建筑发展阶段目标,对《绿色建筑评价标准》相关的控制项、一般项和
对相变材料在墙体中的封装方式(直接混合、宏观封装、微观封装和定形相变材料封装)、相变材料的种类和物性等方面的研究进行了归纳总结.从实验和模拟2个方面,对相变材料位于
高校大学英语学业测试覆盖面广,社会影响力大,其重要性不容忽视。因此对其反拨效应的监控是测试研究的一个重要命题。本文首先分析了本地区英语教师掌握英语测试反拨效应理论