论文部分内容阅读
本文对中国国家漏洞数据库的漏洞数据进行不同方法的聚类分析,并比较分析结果,得出潜在的可靠的划分方法。数据预处理,找出合适的漏洞数据字段,去掉描述性不强或不完整的字段,提取漏洞描述文本并进行分词。对预处理结果进行距离度量,然后依次进行基于划分的K均值算法聚类和基于密度的DBSCAN算法聚类,评估比较聚类结果,找出潜在漏洞划分方法,并比较两种聚类方法的优点与缺点。