面向社会面动态分析的命名实体识别与可视化方法研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:xpzcz1990
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,计算机与信息处理领域的相关技术越来越成熟,为进一步提高军事信息化水平提供了科学技术保障[1]。目前,武警部队在社会面动态情报信息分析处理工作中对数据和信息的运用基本上还是停留在人工查询和简单统计层面,工作人员只能通过人工阅读浏览,才能找到其中的重要信息,工作十分繁琐且效率低下。由此,信息抽取技术应运而生,命名实体识别作为信息抽取技术的基础性研究工作,已经受到广泛的关注。从海量社会面文本信息中快速找到重要信息,不但可以提高工作效率,而且有利于日后的统计分析,为首长全面准确掌握当地社情、民情、敌情提供技术支撑,为定下处置决心提供智能辅助决策。本课题主要针对社会面动态文本信息开展研究,主要工作包括以下三部分:1、中文命名实体识别工具的评测与研究。基于1998年《人民日报》语料库对当前三个主流开源工具LTP、HanLP、BosonNLP分别进行了分词与命名实体识别性能评测,分析总结了它们的共性问题及优缺点,并使用三种工具对社会面动态文本信息进行实验对比。结果表明,BosonNLP在社会面动态文本信息中的识别性能表现最优,F值最高达到了90.27%。2、特征聚类与CRF相结合的命名实体识别方法研究。从本课题的实际应用出发,提出了特征聚类与CRF相结合的命名实体识别方法,该方法首先将已经分好词的预处理语料进行词汇向量化表示(词向量),然后通过K-means聚类方法进行聚类,把聚类后的类别特征作为一个外部特征加入到CRF模型中。最后,将本文提出的方法与BosonNLP、传统CRF模型进行实验对比,结果表明,本文提出的特征聚类与CRF相结合的命名实体识别方法在社会面动态文本信息中的人名识别准确率提高了5.41%,召回率提高了3.01%,F值提高了4.21%;地名识别的准确率提高了3.79%,召回率提高了2.87%,F值提高了3.34%。3、基于高德地图API的社会面动态信息可视化。使用社会面动态分析的命名实体识别结果,通过在线数字地图可视化的方法从时间维度、地区维度、案件性质维度三个方面综合展示当地社会面情况,为首长全面直观地掌握当地社情、民情、敌情提供技术支撑,为定下处置决心提供智能辅助决策。
其他文献
<正>党的十六届六中全会提出有开创性意义的以人为本,构建社会主义和谐社会的指导思想和战略任务。促进"积极老龄化"的方针是为了构建和谐社会的根本目的。人们必须从生命全
会议
<正>一、概述从四十年代电火花加工技术发明至今,电火花机床以数字控制发展到目前的微机控制,其结果是,加工精度和表面粗糙度有明显的改善。但就其加工对象而言,主要是金属。
会议
轮胎均匀性是影响车辆行驶性能的重要参数之一,依据从事YLS系列轮胎低速均匀性检测设备的检测机理研究与设备研发及工业化推广应用的实践过程,简单介绍了轮胎低速均匀性的检
采用灌胃法,对96只小鼠进行黄芪(Radix astragali)多糖低剂量治疗组50 mg/kg(LPG)、中剂量治疗组100 mg/kg(MPG)、高剂量治疗组200 mg/kg(HPG)处理,以灌胃去离子水为对照组(C
近年来,DHA(二十二碳六烯酸)在食品尤其是婴幼儿、孕妇和哺乳期妇女食品中的应用越来越广。DHA来源于鱼油或微藻油,可是鱼油中可能含有多种持续性有机污染物和能抑制儿童生长
目的探究雷尼替丁与多潘立酮联合应用治疗慢性胃炎的临床效果。方法随机选取自2016年9月—2017年10月间在该院接受慢性胃炎诊治148例患者作为研究对象,将入选对象分为探究组
磨煤机和煤粉分离器是锅炉制粉系统重要的设备,选择磨煤机主要依据煤的特性,其中以挥发分Vdaf、水分Maf、可磨性系数Khm、磨损指数Ke及由它们决定的煤粉细度R90为主选择。而
目的探讨中性粒细胞与淋巴细胞计数比(NLR)对卵巢子宫内膜异位囊肿的诊断价值。方法选取唐山市妇幼保健院自2015年1月至2017年1月收治的104例卵巢囊肿患者为研究对象。按照美
在江西省赣州市赣县、信丰县、安远县、寻乌县选择6片典型脐橙园,系统采集岩石、土壤、脐橙果实样品,通过测试分析,采用单因子污染指数法和综合因子污染指数法对脐橙果园土壤
介绍一种新的应用于三值系统的九相相移键控信号,并讨论了实现三值数字相位调制的一种方法,为用于三值CDMA通信新体制打下了必要的基础。