论文部分内容阅读
随着我国在司法机关大力推行案件信息公开,人民群众对公检法等话题相关事件的关注日益增长。网络舆情虽能推动司法改革和进步,却往往泥沙俱下,尤其是恶性舆论向司法机关施加的压力将干扰司法权的独立。然而,司法独立与尊重民意并不矛盾。舆情监测技术的支持,可以极大缓解司法机关的公关压力,促使司法机关更公正公平地行使权力。舆情监测是一项交叉了社会科学和数据科学、融合了多种技术的复杂系统。本文立足于实际需求,结合了对舆情监测的技术研究和系统实现两方面的工作。本文介绍了面向司法领域的舆情监测系统的实现方法,并基于系统采集的海量真实数据,进行了多项相关技术的研究。本文探索了多种机器学习算法与图论知识在结构化舆情数据上的应用。包括对不同类型舆情事件的传播规律进行定量和定性的分析;基于初期传播状态对最终传播层级的预测;基于当前传播状态对次日传播趋势的预测;以及对传播网络中的意见领袖进行挖掘等。本文也探索了多种深度学习与自然语言处理技术在文本类型的非结构化数据上的应用。包括在热点话题中智能识别公检法等话题相关的舆情事件;在海量微博评论文本中检测用户的情感;以及在事件相关新闻报道中挖掘事件相关要素等。系统在各项任务指标上均取得了较好的表现,并在实际生产环境中落地使用,相关研究具有较高的应用价值。