社交网络在线事件检测及分析方法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:FLASH920
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社交网络在全世界的普及使用,现实生活中发生的绝大多数事件总能在第一时刻被相关用户在各类社交平台上报道,因此利用社交网络数据进行实时事件检测可以显著提升事件发现的实时性和全面性,可以有效提高政府机构对突发事件的应急响应能力。但是,由于社交网络的开放性和随意性,使得社交网络数据具有不准确(数据存在大量噪声)、不完整(例如文本通常较短)等特点,使得利用社交网络数据进行事件检测的准确率和可靠性都较低。针对上述问题,本文开展社交网络在线事件检测和分析方法研究,主要贡献概括如下:(1)提出了基于时空突发性的文本去噪方法。事件词在时空分布上具有突发性,而噪声词在时空上是随机分布的。该方法通过拓展空间Ripley’s K函数为时空Ripley’s K函数实现事件词和噪声词差异性的描述,进而引入图正则化算法降低事件词和噪声词区分对分界阈值的敏感性。通过删除不包含事件词的文本实现原始文本数据流的去噪。将该方法应用在真实社交网络数据中,能在不损失事件信息的情况下去除绝大部分噪声数据。(2)提出了基于信息传播特征的在线事件检测方法。该方法首先从文本、语义和词共现三个角度构建相似性,用聚类方法识别描述相同事件的不同文本,然后再用异质图对文本聚类结果中包含的内容、用户及它们之间复杂关系表示的基础上,利用基于元路径的节点间互达概率量化异质图的同质性,对无用信息和事件信息在传播规律上的差异进行区分,进而实现真实发生事件的判断。本文提出的方法在真实的社交网络数据集上取得了优异的结果,相比于当下主流的工作Geoburst+、EDMC和Even Tweet,在事件检测结果的准确率、召回率和F1值上至少高出17.3%、14.1%和15.7%。
其他文献
多锅炉共用脱硫塔燃煤电站中的母管制烟道系统结构复杂,极易因风机跳停引发多机组炉膛压力冒正非停以及脱硫塔和烟道压力冲击损坏。然而,大多数电厂的母管制烟道系统运行和操作水平较低,针对于生产实际中增压风机跳停事故的应对方案制定及其优化主要依赖经验、缺乏理论指导,难以兼顾系统的经济性和稳定性,且稳定工况下的运行能耗问题也有一定的优化空间。为此,本文以某360 MW热电厂9炉7塔的母管制烟道系统为研究对象,
学位
时间触发以太网(Time-Triggered Ethernet,TTE)给普通的以太网带来了高实时性、高可靠性的优势,使其在工业控制领域应用颇多。随着航空电子的发展,光纤通道(Fibre Channel,FC)——一种高速的数据传输协议逐渐取代传统的航电数据总线。近年来有学者将时间触发机制(Time-Triggered Mechanism,TTM)与FC网络相结合,即TT-FC,TT-FC网络将消
学位
混凝土作为世界上使用最广泛的建筑材料之一,关于其耐久性的研究越来越受到关注。每吨水泥的制备过程中能产生0.9吨的二氧化碳,在世界范围内,制造水泥时所产生的二氧化碳约占全年人造二氧化碳的6%-7%。而提高混凝土的耐久性能在一定程度上减少水泥的生产,对减少碳足迹具有十分重要的意义,有利于绿色可持续发展。混凝土的耐久性与水分子和离子在其纳米孔道中的传输有紧密联系,而该领域在宏观层面上的研究也已经相对成熟
学位
无人机(Unmanned Aerial Vehicle,UAV)作为一个空中飞行的平台,由于其固有的特性,如移动性、灵活性和自适应高度,在军事、监测、远程通信、灾后重建等场景都有着许多的应用。UAV不仅可以作为空中基站来增加无线网络的覆盖面积、容量、鲁棒性和能量效率,还可以作为数据收集和无线充能的平台来对无线网络中的设备提供服务。与传统的基站通信不同,UAV可以通过飞行尽可能地避开障碍物,从而有更
学位
随着汽车产业和信息技术的发展,新兴的智能网联汽车具备有环境感知和信息共享的能力,人-车-环境互联的车联网络应运而生,为提高交通效率和交通安全提供了可行解决方案,如其中的安全类应用可以传输紧急事故预警消息,娱乐类应用可以提高驾乘人员的出行体验。网络通信是实现这些应用服务的必要条件,车联网中数据包经过多跳传输从源节点发送到目的节点,车辆和路边基础设施在路由过程中充当中继节点。然而,车联网的特性使得车联
学位
随着信息技术的高速发展,许多计算密集型和延迟敏感型的新兴应用(例如增强现实(Augmented Reality,AR)、虚拟现实(Virtual Reality,VR)、云游戏等)涌现出来,带给用户前所未有的体验。但是这些应用很大程度上受到了用户设备有限资源的限制。依托于过去几年蓬勃发展的云计算技术,用户可以将这些应用涉及的复杂计算任务上传到具备强大处理能力的云服务器上进行处理。尽管这样的方式能够
学位
随着我国社会经济的快速发展,高层及超高层建筑的数量与日俱增,钢板组合剪力墙结构因其承载力高、刚度大、延性好等优点在高层建筑中得到了广泛的应用,其构造形式也不断创新。桁架式多腔体钢板组合剪力墙是一种新型的钢板组合剪力墙,其外侧的双钢板通过内部钢筋桁架相连,从而形成了多个竖向连通腔体,在内部浇筑混凝土,有利于提高施工效率,在高层建筑结构中有着广阔的应用前景。钢板剪力墙一般墙体厚度较薄,当在结构中沿厚度
学位
近年来,各种互联网应用的不断发展,导致全球用户数据流量不断上升,对光传输系统的传输速率提出了更高的要求。这些互联网应用大多数是中短距离光传输系统,更加注重系统成本与复杂度,因此,高速直检系统引起了国内外研究人员的广泛关注。但是,低成本光电器件的带限和光纤色散等因素严重影响了高速直检传输系统的性能。为了改善其传输性能,提高传输容量和传输距离,本文对高速直检光传输系统中的收发端核心信号处理技术展开研究
学位
碱性磷酸酶(APase)是最主要的有机磷水解酶,在无机磷匮乏的情况下,APase释放的无机磷供藻类利用,致使藻类大量繁殖,因此,对APase基因多样性的研究有利于揭示对水体富营养化有重要影响的微生物类群.基于此,本文以珠江水体为研究对象,构建了珠江广州段穗石、坦尾和南沙3个点细菌的pho D基因克隆文库.限制性酶切片段多态性(RFLP)分析结果表明,上述3个点的pho D基因分别含有15、17、1
期刊
在自定心混凝土框架结构中,预制梁柱采用无粘结预应力钢绞线进行拼装,并在梁端设置摩擦耗能件,在地震作用后框架在预应力作用下恢复到原来的中心位置,从而消除结构的震后残余变形。为了使填充墙与自定心混凝土框架结构的力学特性相适配,减少填充墙对框架的不利影响,提出了一种滑移填充墙:该墙体由上下两块预制墙板和摩擦滑移装置构成,在地震作用下两块墙板可发生相对滑动,并通过摩擦滑移装置耗能。针对含滑移填充墙的自定心
学位