论文部分内容阅读
通过对构建舆情数据中心为研究对象,主要基于舆情资讯展开的一系列的数据采集监控和分析挖掘任务,可提供包括网页数据爬取与监控、网页数据解析、文本数据预处理、文本分析与挖掘等自然语言处理功能。研究表明自动摘要技术、事件识别技术、事件脉络梳理和情感分析技术能基于文本挖掘算法,实现对文章关键字自动提取、内容精简、相似度计算、跟踪监控和对带有情感色彩的主观性文本进行分析有很好的应用价值和效率。