论文部分内容阅读
近年来Web2.0高速发展,移动互联网技术得到不断普及,世界已经进入了以数据为中心的范式——“大数据(Big Data)”时代。从大数据量、结构复杂且增长迅速的数据中寻找到有价值的信息和知识并加工成情报,对于决策和风险预警等有重大的意义。传统的情报分析方法主要以人工分析和检索式分析为主,存在以下问题:(1)人工分析无法完成大量情报素材的分析任务;(2)检索式分析只能抓住某些关键词,对情报素材内容的把握很片面;(3)分析结果以表格和文字描述,情报中蕴含的知识性和规律性体现不明显。本文首先回顾了国内外相关技术的研究现状,介绍了内容分析法和涉及的关键技术。其次为了解决传统情报分析方法不能全面把握情报内容的问题,提出了基于内容分析法的情报分析模型;针对传统K-Means算法聚类结果不稳定的问题,提出了一种优化K-Means文本聚类算法;为了解决情报知识难以直观体现的问题,提出了基于分层的知识图谱构建方法。最后,将研究成果应用于某地公安情报分析系统。本文的主要研究内容概括如下:1.针对传统情报分析方法不能全面把握情报内容的问题,结合内容分析法提出并设计了一个典型的三层结构的情报分析系统模型。该模型以内容分析法为基本框架,使用NoSQL数据库技术为数据存储提供支撑,能够利用文本挖掘技术对情报素材的内容进行全面分析。2.提出了一种优化的K-Means算法进行情报聚类分析,实验验证表明,该算法适用于情报聚类,聚类结果的纯度有较大提高。3.对利用内容分析法挖掘出的信息,提出了基于分层的知识图谱的组织和构建算法。该方法能够取代传统的图表和文字描述将情报素材中的现象和知识以图谱的形式展现出来。4.在以上研究的基础上,将研究成果应用于某公安情报分析系统,设计实现了情报文本预处理模块、案件串并模块和情报自动聚类模块,构建了情报的知识图谱,发现了情报素材中蕴含的某些知识。