基于微博的公共安全事件提取和风险评估

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:guao_jie
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博发展迅速,是一种流行的在线社交网络。微博用户数量巨大,且内容具有实时性,因此它是研究人员挖掘公共安全相关信息的有用工具。基于微博的公共安全事件提取和风险评估,一方面能够快速获取公共安全事件,让相关人员了解当前发生的安全事件;另一方面通过对事件进行风险评估,能够让相关人员了解不同公共安全事件的风险状况,从而有效进行安全防控。本文将事件提取算法应用于公共安全领域及中文微博。本文旨在发现适合公共安全领域及中文微博的事件提取方法,将其用于相应系统。本文主要采用基于突发词的公共安全事件提取算法,同时和基于文档的方法进行了对比。文中分析了公共安全和非公共安全的事件提取的区别。例如,其提取需要更高的实时性,且决策者往往仅关注某一范围的事件,因此也和位置相关。在基于突发词的方法中,将不同微博按照省份分组;在每个组内提取出微博文本中的关键词,利用频率变化过滤出突发词,将其表示成向量;而后利用Single-pass聚类算法,将突发词向量聚类,得到的不同的类别;最后对每个类簇进行分析合并,得到不同的的公共安全事件。算法的选取考虑了公共安全事件对于实时性的要求。同时,文中采用复旦大学公共数据集,用实验对比了突发词和文档的事件提取方法的结果,实验表明基于突发词算法的精确率和召回率均高于基于文档的方法,而效率却更高。在公共安全事件提取后,本文提出了基于影响力和情感的公共安全风险评估算法。针对微博数据,采用影响力和情感两个指标,它们不仅能够通过微博数据有效获得并计算,同时能反映一个事件的发展态势以及人们的心理,进而能够评估风险。本文利用提取出的事件,结合最近的武汉新冠肺炎相关微博,分别采用矩阵定级法和模糊综合评价法等定性法和定量法对相关事件进行风险评估。在计算影响力时,基于Page Rank和用户行为;计算情感时,采用Valence-Arousal二元情感空间表示法,基于SVM和LSTM的回归模型,得出事件的情感极性值和强度值。最后,在公共安全事件识别后的相关微博上,采用定性和定量评估算法进行了实验,得出了不同事件的风险等级。结果表明两种方法均大致符合实际,而矩阵定级法更加直观。同时,结果表明了提出的影响力和情感指标的有效性。最后,设计实现了公共安全事件提取和风险评估系统,验证了采用的事件提取和提出的风险评估算法的可行性。
其他文献
随着我国互联网技术的发展,如今已走在世界前列。互联网经济在带来巨大经济利益的同时也导致互联网经营者之间不正当竞争事件频发。但我国当前并没有相关规制互联网不正当竞
在当前的工业界,GPU程序的开发和维护已经成为了重要的新平台。机器学习的任务在GPU平台上能够获得更加优秀的效果。CUDA(Computer Unified Device Architecture)是n Vidia开
消化内镜微创手术器械交互安全预警系统旨在对多器械消化内镜微创手术中手术钳器械操作力的安全性进行实时监控。系统主要由肿瘤分割、手术器械分割、手术钳末端位姿估计、手
中国古代经典《西厢记》为蓝本的各种艺术创作,为中国传统陶瓷绘画广泛借鉴和运用,甚至形成了一时的流行风尚,在江西景德镇大量生产,特别在清代至民国广泛运用于工艺品、家居
激光线结构测量系统通过线激光器作为主动光源照射至待测物体,再通过CCD或CMOS相机对待测物体表面反射激光条纹进行采集记录,对采集得激光条纹图像进行处理以提取待测物体的
互联网的快速普及和发展促使数据量呈爆炸式的增长。协同过滤推荐技术通过分析用户属性、项目属性、用户与项目的交互记录挖掘用户的兴趣,主动提供用户可能感兴趣的内容,在缓
量子隐形传态是量子网络和可拓展量子计算的重要组成部分,凭借其广阔的应用前景吸引着学术界的广泛关注。量子隐形传态的目的是利用纠缠资源和经典通讯实现量子信息从一个端
近年来,随着计算机技术,现代传感器以及成像技术的高速发展和广泛应用,人们需要处理,分析和恢复维度更高,规模更大,结构更加复杂多样的数据。而在采集和传输过程中,这些高维
随着当事人在普通民事诉讼中提请财产保全申请的数量增多,因财产保全申请错误而损害被申请人和第三人利益的赔偿纠纷也日益增多,但关于财产保全错误损害赔偿纠纷的法律适用,
新《预算法》第35条规定省级政府可在国务院批准的限额内发债,且明确指出地方政府不被允许采用其他方式筹集投资建设所需要的资金。自此地方政府不得再以融资平台此类形式变