论文部分内容阅读
国家冲突行为预测在国际关系研究领域是指对战争、武装对抗、政治动荡等问题的爆发、持续以及伤亡情况的预测分析,能够为提前制定战略决策提供一定的辅助支持。随着大数据和自然语言处理等技术的发展,使得基于公开海量新闻数据进行冲突行为预测成为可能。国家冲突行为量化预测研究中广泛采用的“事件数据分析法”具有对领域专家知识依赖强、时效性差等问题,本文综合利用人工智能领域相关技术,从互联网抓取海量新闻数据进行文本特征提取与预测模型构建,通过动态贝叶斯网络模型构建了南海问题中我国与其它七大参与国家间的冲突预测模型,论文主要研究内容如下:首先,提出了一种融合层次聚类、单词贡献度(Term Contribution,TC)与潜在狄利克雷分布(Latent Dirichlet Allocation,LDA)主题模型的特征自动抽取算法,采用多项式逻辑回归构建冲突预测模型。所提算法采用层次聚类解决了LDA主题模型需要确定主题数目的问题,融合TC与LDA从海量新闻数据中提取更具表征性的主题词特征。基于提取的主题词构建主题向量,将主题向量依次输入多项式逻辑回归模型迭代训练,得到国家冲突行为趋势预测模型。通过对朝鲜核行为和叙以冲突的预测验证了提出算法的可行性和有效性。其次,由多国参与的国际事件中,各国间的冲突行为除受到双方的影响,还受到其它国家间双边关系的制约。为构建南海问题中我国与其它七大参与国间的冲突行为预测模型,提出了一种基于事件抽取(Event Extraction,EE)、时序贡献度(Timing Contributions,TCs)与动态贝叶斯网络(Dynamic Bayesian Networks,DBN)的国家冲突行为预测方法。按月划分新闻数据,提取特征词,根据频次等计算每月的TCs。基于专家制定的事件分值表与基于模板匹配方法得到的事件抽取结果构建国家冲突行为数据集,将其输入融合TCs的DBN模型进行结构和参数训练。构建的我国与其它参与国在南海争端问题的冲突行为预测模型预测精度达到了75.7%,并对各国间冲突行为的相互影响进行了分析。最后,对本文进行了总结与展望。