论文部分内容阅读
互联网技术的不断发展,带来了人们收集、存储和管理知识的能力的不断增强,然而人们理解知识的能力并没有在行为习惯、思维方式上得到显著提高。在“信息爆炸”的时代,人们获取的信息量已经足够大,但是如何获取最切合自己需求的有效信息,过滤垃圾信息以及如何将这么大量的信息完全的阅读,成为摆在我们面前的一个难题,这就是“信息爆炸”带来的“信息陷阱”、“信息迷航”等问题。针对这些问题,国内外专家学者提出了不少理论和方法,其中最重要的是进行知识组织以及知识的可视化。本文在研究国内外文本挖掘及聚类结果可视化现状的基础上,在文本挖掘系统中引入SOM神经网络算法,该算法在知识可视化方面效果比较突出。但是,单纯照搬SOM算法进行文本挖掘聚类存在效率上的问题,由于互联网上的文本信息呈指数级的增长,挖掘的结果不断增加,会导致聚类效率严重下降,因此要对算法做一定的改进。利用国防词汇本体非常清晰的层次结构,作为SOM的输入神经元以及聚类结果的输出模板,逐层进行聚类,能够很好的将文本挖掘系统采集到的防务信息聚合成有序的知识并以色块图,线图,柱图,饼图,立体柱图,立体饼图多种形式展现给用户。实验结果表明:这种方法聚类结果准确,且效率比较高,解决了大样本下SOM聚类效果不好的问题。同时可视化展示界面采用树图结合的形式,简单明了,用户体验更好,方便用户了解热点问题、获取知识、便于支持决策。