论文部分内容阅读
随着科技的进步,网络的发展突飞猛进,网络媒体已发展为继报纸、广播、电视之后的“第四媒体”,2008年初中国网民数量更是超过了美国成为世界第一。网络的发展使网络已经成为社会舆情的主要载体,每天都会有海量的有价值的舆情信息产生于网络并广泛传播。但与此同时网络也成为一些不法分子用来实施犯罪行为或者传播违法信息的重要工具,网络在带给我们众多方便的同时也给社会安定带来了一定负面影响。在这样的背景下,公安部门对于网络舆情的掌握显得尤为重要。随着公安部门“实施科技强警战略、建立公安情报信息系统”的目标提出,公安网络舆情分析系统的建设需求空前迫切。本论文结合公安部门网络舆情分析系统需求,对公安情报工作中的网络舆情分析的相关技术进行研究,并结合公安部门已有的“公安情报信息综合平台”探讨了舆情分析系统的设计与实现,提出了一套系统与综合平台的互联接口方案。论文首先分析了系统的研究背景与意义,介绍了网络舆情情报的采集和分析研判等基于网络舆情分析的公安情报工作的相关技术;接着给出了系统的总体设计方案,包括业务流程、架构设计以及与公安情报信息综合平台的相关接口设计等,并给出了系统与该平台互联的完整解决办法,同时详细研究了核心模块-分析研判模块的设计,包括了Web信息智能处理、多媒体信息检索和人脸识别三个模块;最后给出了系统关键技术的实现方案。本论文的主要研究成果有:提出了构建于“公安情报信息综合平台”基础上的公安舆情分析系统的总体设计方案,该方案包括了舆情分析系统与“公安情报信息综合平台”的接口方案和分析研判功能模块的设计;实现了基于DOM规范的树状结构的Web文本预处理方案;研究了开源的搜索聚类引擎Carrot22.0,并在此基础上结合Carrot2的API实现了基于Lingo聚类算法的文本聚类功能;通过对异构数据集成中间件技术和Xml技术特点的研究,引入了基于Xml的中间件技术解决了系统中异构数据源的集成问题。