基于SOM聚类的WEB文本挖掘及其结果的可视化研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:yyk20071999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的不断发展,带来了人们收集、存储和管理知识的能力的不断增强,然而人们理解知识的能力并没有在行为习惯、思维方式上得到显著提高。在“信息爆炸”的时代,人们获取的信息量已经足够大,但是如何获取最切合自己需求的有效信息,过滤垃圾信息以及如何将这么大量的信息完全的阅读,成为摆在我们面前的一个难题,这就是“信息爆炸”带来的“信息陷阱”、“信息迷航”等问题。针对这些问题,国内外专家学者提出了不少理论和方法,其中最重要的是进行知识组织以及知识的可视化。本文在研究国内外文本挖掘及聚类结果可视化现状的基础上,在文本挖掘系统中引入SOM神经网络算法,该算法在知识可视化方面效果比较突出。但是,单纯照搬SOM算法进行文本挖掘聚类存在效率上的问题,由于互联网上的文本信息呈指数级的增长,挖掘的结果不断增加,会导致聚类效率严重下降,因此要对算法做一定的改进。利用国防词汇本体非常清晰的层次结构,作为SOM的输入神经元以及聚类结果的输出模板,逐层进行聚类,能够很好的将文本挖掘系统采集到的防务信息聚合成有序的知识并以色块图,线图,柱图,饼图,立体柱图,立体饼图多种形式展现给用户。实验结果表明:这种方法聚类结果准确,且效率比较高,解决了大样本下SOM聚类效果不好的问题。同时可视化展示界面采用树图结合的形式,简单明了,用户体验更好,方便用户了解热点问题、获取知识、便于支持决策。
其他文献
期刊
碳酸氢铵是当前生产中使用量较大的一种化肥,但因其极易分解挥发,若施用不当,往往造成损失,肥料利用率不高。通过本试验,初步摸索出较好的施用方法,供大田使用碳酸氢铵时提
期刊
早稻采取燥田割稻,可以割到那里稻草晒到那里,减少背草工,加快收种进度,便于细打细收,谷粒清洁无泥又可避免蚂蝗为害。但事物都是一分为二的。据奉化、鄞县等地调查,早稻燥
期刊
期刊
我们的报纸,应该把丰富复杂的社会生活中有新闻价值的事物及时反映出来。但是这几年,报纸日益变得杂志化,新闻阵地日益缩小。翻开一张报纸,二三版多是大块文章。就是有些新
期刊
期刊
体育教学活动中学生发生意外伤害事故是难以避免的,特别是对小学生而言,由于年龄、认识等方面的原因,更增加了意外伤害事故发生的几率.因此,采取措施,尽可能地减少事故发生的